即刻App
年轻人的同好社区
下载
App内打开
Shawn_He
322
关注
21
被关注
0
夸夸
十年饮品人
AI 探索者
Shawn_He
11月前
翻译的话,用v3就够了。可以接siliconflow 的API ,速度目前比官网快。
看科技类的推文,实测用GitHub翻译专家体验更好,会保留大部分专业用词。
张翼轸: Deepseek R1 的翻译质量还是相当赞,配图左边是沉浸式翻译“科技翻译大师”搭配 Deepseek V3的翻译,右边是 R1 的翻译,明显后者文字顺畅许多。唯一缺点,R1 太爱思考,画蛇添足将特朗普变成了前总统(红色画线处)。不过,R1 速度太慢,不适合沉浸式翻译这种求快的场景,但用于不求速度的高质量翻译,的确不错。
0
0
0
Shawn_He
11月前
阑心一言,无可取代
阑夕ོ: 因为始终没有等到真正意义上的杀手级应用,AI很大程度上依然是一个新闻/资讯驱动型的行业,也就是隔三差五来一波「炸裂」,更新一下人类岗位被取代的进度百分比,然后大家继续该吃吃该喝喝,循环往复。 而普通人到底能用AI做什么,回答这个提问本身就是最大的PMF,大大小小的AI公司过去一年里都在寻找答案,但没有人敢自称已经找到了,别问,问就是未来可期。 在我看来,DeepSeek-R1的最大贡献,其实是把高阶AI给平权了,之前整个行业都在走生产力导向的路线,重视AI的提效价值,由此把高算力成本合理化,用「星际之门」这样的宏大工程叠加资本预期,成了唯一正确的方向。 所以Sam Altman说200美金/月的ChatGPT Pro在账面上是亏损的,OpenAI和微软合作了那么久,一旦新的数据中心需求被卡审计了,马上转头就和甲骨文勾兑上了,狼性归狼性,这条路确实是会越走越窄的。 AGI固然是个好东西,但它显然不应该建立在用起来肉疼这个前提上,无时不刻的向用户施以心理暗示,每次提问有没有创造足够的价值,如果没有,就不要浪费寸卡寸金的算力了,这就是生产力导向的叙事。 DeepSeek的最近3代模型,技术转进的阶梯感非常明显,V2是把AI的调用单价打下来,V3是在低价的同时跟上主流大模型,R1是加质不加价直接对齐最前沿的模型能力,保持不变的参数只有普惠这一条。 智能这种资源,也可以像水电煤一样取之即用,而水电煤的普及则会同时造福于工业生产和生活消费两端,对于AI行业来说,这是非常祛魅的设想,所以据我所知,大厂对于DeepSeek的这波出圈,感情上相当矛盾。 倒也不是不能理解,矛盾是因为短期损益和长期受益的混合。 短期损益在于堆卡这种变相发行入场券的游戏规则被打破了,本来可以靠财力储备去限制竞争对手的入局,现在行不通了,每个玩家都可以尽快站在巨人的肩膀上,看看GitHub上和DeepSeek有关的开源项目是怎么雨后春笋般出现的,就明白了。 长期受益在于加速AI的平权实际上有利于整个行业更快扩大消费级市场,而不是只能在降本增效的SaaS市场里作威作福,尤其是考虑到中国的SaaS产值本就疲软,让更多的用户可以一键获得最顶级的模型,为行业创造需求规模,堪称功德无量。 所以我不认同那种认为DeepSeek的成功是一种对抗性的胜利,这太强行了,而且如果你的崛起就会让别人遭殃,这样的狂热捧杀非常败坏路人缘,比如幻方其实是最早开始囤英伟达显卡的公司,要说英伟达因为DeepSeek崩了,梁文锋自己都得扣个问号。 优秀的公司涌现出来,一定会让全行业都变得更繁荣,包括也将推动竞争对手的进步,这和主观意志无关,是经济世界的客观规律。 而且如果你们真的看进去了梁文锋屈指可数的那几次对谈,就会发现他其实是一个纯粹远大于情绪的创业者,采访他的记者说幻方/DeepSeek带有强烈的文化吸引力,无论是组织还是做事,都遵循着有没有热情这个基本逻辑,包括找人也是,热情是藏不住的。 梁文锋自己打的比方,是买钢琴,一来要买得起——原始积累很重要——二来也得有一群急于在上面弹奏音乐的人,所以我很确信他不太会被噪音裹挟,事实上这次爆火,连加班都没怎么增加,发布的更新都是按照既定计划安排的。 不过国产AI行业也是实打实的连续两年没过好年了,不同的是,去年是惊惶焦虑,今年是志得意满,反转情节是真的爽。 很多人可能不太记得一年前是个什么形势了,我来帮你们唤醒一下长期记忆: 2024年2月,OpenAI在龙年大年初五发布了视频大模型Sora,和当时的视频大模型都是动态图片水平完全不同,演示里的运镜和动作无比流畅丝滑,再次上演了让全硅谷都看不懂的剧本。 那会儿的中国AI公司,处于一种集体懵逼的半植物人体征: 市面上能用到的最好产品是百度的文心一言——别笑,真就如此——李彦宏以胜利者的姿势劝大家放弃重复造轮子,字节跳动的CEO梁汝波在内部大会上起头反思公司为什么错过了GPT这场技术革命,朱啸虎锐评国产大模型公司没戏的「投降论」在朋友圈里刷屏,阿里因为FOMO的原因投了「AI六小龙」里的五家后被马云质疑「投这么多是不是看不懂」,腾讯则保持「超出三界外不在五行中」的查无此人状态,再往前一点,王慧文抱病撤出由他一手筹建的光年之外,不可置信的坊间传闻说是意识到追不上了所以才激流勇退⋯⋯ 这就是一年前的真实局面,当时没人能想到,翻盘能够来得如此之快,在短短一年时间里,从不够资格上桌吃饭,到霸榜全球应用商店,急风骤雨,摧枯拉朽。 我要说的是,DeepSeek不是一根孤单的独苗,比偶然更好更好的事情是必然,国产AI阵营这一年来的集体成长,兜住了很有可能是这一代人工业革命的在场权,能够正面迎战饱和式竞争: 有字节这样全量对标的,豆包、扣子、Trae成套开发,走的是用高投入换高回报的路线; 有通义这样正统开源的,通义家族的谱系之发达,已经在各大竞技场里刷了一年的分了; 有月暗这样精耕细作的,Kimi 1.5也是不逊色于o1的思维链模型,就是很不幸的和DeepSeek-R1撞车了哈哈哈; 有快手这样半路杀出的,可灵现在就是全球最强的视频大模型,没有之一,对Sora的幻灭要负全责; ⋯⋯ 甚至完全有理由相信,下一个现象级的国产大模型,可能都是上述没有提到的名字,科研固然没有意外,但市场充满随机性。 最后,建议大家勤用DeepSeek-R1,把它当成一个对话帮手,而不只是查询工具,思维链的展开,可以让你更好的理解如何控制需求(Prompt),并对过程中的偏差进行修正,这比只对结果方案提出「不够大气」的模糊反馈,要高效得多。 做好准备,迎接新的人机共生时代。
0
0
0
Shawn_He
11月前
请Gemini出场评价一下Dario的发言。
0
0
0
Shawn_He
11月前
数据这块积累Google还是很有优势的,前阵放出来的Veo 2还是很惊艳。但是对于这种公司数据能不能用起来又是另一回事了。 //
@张翼轸
: 对,我觉得更多还是探索多模态,这个是AGI 必经之路,纯文本是易得高度压缩的素材,但广泛性不行。谷歌的 Gemini 2.0 多模态那么强,不知道与谷歌地图那么多年街景地图车搜集的素材是不是有关系。接下来 AI 眼镜、AI 耳机,可能都会成为新的信息来源。
Shawn_He: 从昨天晚上的闭门会看,目前纯文本的数据已经到瓶颈了,Janus 7b更像是在探索更广维度的数据。真正的世界模型还是要从多维度的数据来理解真实世界的。
0
0
0
Shawn_He
11月前
印象中24年也是Deepseek 首先把国内一线大模型价格打下来,以至于后续我在沉浸式翻译上接的都是ds的API 。
这一波是属于直接把国外一线大模型价格打下来,让国际友人直接感受到震撼了。
2
0
0
Shawn_He
11月前
从昨天晚上的闭门会看,目前纯文本的数据已经到瓶颈了,Janus 7b更像是在探索更广维度的数据。真正的世界模型还是要从多维度的数据来理解真实世界的。
张翼轸: 文生图这块,美学需要的素材积累,是个大门槛。不过包括 SD 之类也是这块的限制,Midjounery 之后各家也就是在 Lora 或者图片上生成文字之类细分领域找突破。我估计 Deepseek 可能也志不在此,更多是考虑多模态识别图片,而不是考虑生成图片有多好。
1
2
2
Shawn_He
11月前
生理性厌恶那些说着 AI 本质是工具,然后以为自己洞察一切的人。要不您去问问纺织女工是怎么看的?
0
0
0
Shawn_He
1年前
叶安杰Alger: 一小时前海外独角兽发的AI-native应用长什么样的文章,刚刚在工作偶然看到。速读+take away了一下,几点感兴趣的内容 能够智能且无干扰地将反馈整合到用户体验中? 跨结构化和非结构化数据的处理能力将成为充分发挥生成式 AI 潜力的关键。 AI 生成内容的元数据 记录 AI 创建内容的过程信息,例如: 生成内容的时间戳 使用的模型和参数 用户输入的 prompt 内容的修改历史 数据模式识别 微观层面: 单个用户的使用习惯 具体场景下的交互模式 特定任务的解决方案 宏观层面: 大量用户的行为趋势 跨场景的共性特征 整体业务流程的优化方向 具备共享记忆功能的智能代理(agents)将成为多层次超个性化最完整的体现形式。
0
0
0
Shawn_He
1年前
除了这个老哥,还推荐 Riley brown,和Ray Fernando(前 Apple 工程师),最近都高产 cursor 相关的内容。
哥飞: 找到了,一个带着你用 Cursor 从零开始做项目的Youtube频道 https://www.youtube.com/@realmckaywrigley/videos
4
0
1
Shawn_He
1年前
围观回来,感觉这个思路同样可以用于 cursor 等一系列基于 3.5sonnet 代码能力的产品。
用模型更容易理解的交流方式,且本身自带了 cot 的一些规范,会产生更加稳定的结果。
对于有编程基础的人,这个思路一旦打开,能玩的东西就更多了。 //
@AI产品黄叔
: 嗯,看了下宝玉老师在微博的分析,很强
AI产品黄叔: 一个非常明确的趋势 AI Coding 几个产品形态 1 Monica.im的智能工具箱 基于Claude3.5和Artifact创建工具 2 websim.ai 实时生成的网站+聚合站 3 @李继刚 的Prompt svg生成是Artifact的典型能力范围 4 Cursor AI编程 爆火依赖于Sonnet的强大代码生成能力 为此专门写了一篇: https://mp.weixin.qq.com/s/hwOAxwTi4oilCTqx62wyxg
0
0
0