即刻App年轻人的同好社区
下载
App内打开

人工智能讨论组

人工智能or人工“智障”,一起聊聊人工智能新进展?

466242人已经加入

  • punky
    24天前
    o3 太强了,ARC-Prize六月宣布的时候大家还嘲笑目前LLM的无能为力,参见图一倒数第二的 GPT-4o
    结果现在o3“高烧钱模式”在 semi-private 测试集上准确率达到了 87.5%(超过人类水平,85%),见图二(来自出题人)
    我看了下排第二的 solution 是利用 Claude Sonnet 3.5 的搜索算法,让 LLM 生成 python 程序解题,精心设计了复杂的 prompt。作为对比,看看 o3 prompt,“高端的食材只需要简单的烹饪”(图 3,来自这个 prize president)
    总之这个进展是非常夸张的,第一和第二的对比我感觉类似当年 AlexNet @ ImageNet competition
    11
  • Simon的白日梦
    1天前
    开源公众号 Markdown 编辑器:轻松搞定微信图文排版

    🧐 本文介绍了一款专为微信图文排版设计的开源工具「微信 Markdown 编辑器」,通过简单的Markdown语法实现高效、简洁、美观的文章排版,是公众号创作者的理想辅助工具。

    在线体验:

    你可以直接访问在线编辑器,体验 Markdown 排版的便捷:

    👉 doocs.github.io

    开源地址:

    如果你对这个项目感兴趣,欢迎前往 GitHub 查看源码并贡献你的想法:

    👉 github.com

    ➡️介绍文字: mp.weixin.qq.com

    ✨重点

    ● 🛠 核心功能:支持Markdown语法、数学公式、Mermaid图表、代码高亮、自定义样式、多图上传及本地管理等功能,适配多样化排版需求。

    ● 🌐 在线体验与开源地址:用户可通过在线编辑器试用功能,并在GitHub查看源码,支持二次开发与社区贡献。

    ● 📈 结合AI增强:通过AI定制专属模板或优化排版,大幅提升创作效率。

    ● 🔄 长期维护:自2020年发布以来,项目持续活跃维护,提供可靠的使用体验。

    这是一个功能强大且易用的工具,适合技术文章和日常分享排版,特别是结合AI使用,可进一步优化内容创作流程。
    09
  • Diiiii
    4天前
    Agents AI Coding 讨论质量较高的一期播客,比较认同的观点:

    1. AI Coding 不仅仅是狭义的“AI 编程”,而是广义的 "Task Engine",是任务自动化。理论上来说,所有数字世界里单人+电脑能够完成的任务,都可以被这个引擎搞定。因此会出现类似 Agent Company 这种新的 Benchmark,可以将所有工作环境中可能涉及到的任务抽象成为数据集。

    2. 之前这波 AI 落地过于依赖 Chat 了,结果两年下来,发现其实人类并没有那么多问题想要去问 AI,并且开放式聊天的需求也并不是太大,消耗不了太多 token。而任务自动化才是真正可以带来海量 token usage 的场景。可以将任务引擎理解为雇佣了一大堆工资极低的实习生(按照现有成本计算是加州最低工资的一半,但一年之内可能会再下跌一个数量级)。

    3. 当前的 AI Coding 有两个方向。一个方向是更好的 o3,去解决越来越难的问题(现在已经是 Top200 人类程序员的存在),是要攒出牛顿和爱因斯坦,而另一个方向是更好的 Devin,去完成越来越复杂多步的实际任务,是要批量制造数字员工。尽管目前 Cursor/Windsurf(更像是 L2 Copilot) Devin(更像是 L4/L5 的Autopilot) 的路线不尽相同,但长远来看,个人认为 Devin所代表的才是更为终极的形态。

    4. AI Coding 目前面临的挑战,除了 Foundation 模型的持续进化之外,更主要的在于:如何用更多的 Data Integration Data Access 获得更加充分的 Context,消除与人类的信息差(有趣的是有人提到张一鸣曾经说过的字节跳动的管理思路,More Context, Less Control,同样适用于模型);如何更好地使用各种 Computer Use 工具(例如Anthropic的MCP);如何从一条条 event stream 中建立高质量的 feedback loop;等等。

    5. 围绕 Agents 落地会有一波新的机会,除了做各种水平或垂类任务自动化引擎的公司之外,还有各种“服务Agents”的 Infra tooling 机会,比如帮它们标注数据、增强性能、打磨工具链、加深记忆、设置监控、提供反馈、保障安全、协助与人类的沟通等等。

    6. 当执行工作都能够被 AI Agents 搞定之后,未来需要的人才画像是“Founder+CEO”,需要能够提出好问题,需要去思考“做什么” 而不是“怎么做”,需要更多具备产品和用户思维,需要做更多的决策而非执行。这与我们当前教育体系的培养目的是完全不同的。当前教育还是普鲁士工业流水线的遗产,是为了培养熟练产业工人而设计的。但 AI 时代,需要的不再是高效的执行能力,而是“做老板”的能力。

    EP 66. 深度解读Coding Agent与OpenAI o3:中美Agent 创业者、研究员与投资人眼里的未来

    OnBoard!

    06
  • 卡尔李CarlLee
    7天前
    Claude 工程师聊提示词:
    ➡️ Claude 多个工程师参加播客分享对 prompt 的观点
    ➡️ 文章内容太散,使用 海螺 AI 提炼了他们的观点,参看表格
    ➡️ 让我感受最深的是关于“角色扮演和拟人化”,相信大部分人接触提示词最先学到的都是给 LLM 一个角色,然而在 Claude 工程师们看来这是“大可不必”,理由:
    1) 模型并非真正理解人类思维
    2) 模型推理的过程不完全可靠
    3) 角色扮演可能导致误解和误导,比如虚构内容,忽略细节
    4) 最有效的方式是:直接说事,清晰描述,包括目标/步骤/期望输出等

    文章链接:mp.weixin.qq.com
    614
  • 宫铭
    1天前
    WilliamZhu 将 AI 辅助编程工具的发展分为以下几个阶段,很有启发:

    1.自动代码补全阶段(以 GitHub Copilot 为代表):2023 年的 GitHub Copilot 主要功能是自动代码补全,类似于更智能的 tab 键补全,这一阶段还算不上真正的 AI 辅助编程工具。

    2.tab tab (以 Cursor 为代表):Cursor 推出了 tab tab 功能,编写代码时按 tab 自动补全,再按 tab 可跳到下一个可能要修改的地方。
    3.chat 及 apply 功能阶段(以 Cursor 为代表):cursor 之后引入 chat 功能,将 Web 版模型嵌入 IDE,但聊天内容起初无法自动合并到代码中,随后推出 apply 功能,点击后聊天产生的代码可合并进原始代码库,标志着真正意义上的 AI 辅助编程来临。

    4.write 模式阶段(以 Cursor 的 Composer 为代表):实现了多文件输入和多文件修改,能很好地应对一次需求修改多个文件不同区域的情况,目前 Cursor、Windows 11 等都达到了这一级别。

    5.commit 级别阶段(以 AutoCode.chat 为代表):在这一阶段,用户更多作为需求提供者和结果审核确认者,大模型完成中间的写代码过程。用户提出粒度合适的需求后,工具会自动提交一个 commit,用户进入审核界面判断提交是否合理,进而决定是否继续迭代,该阶段具有一定人格化。

    6.PR 阶段(以 Devin 为代表,处于探索中):用户可提出类似于 pull request,Devin 会全程主导完成任务,过程中的需求拆解由其自身完成,目前 Devin 因模型能力不足,自己训练模型,但整体成本、效果和时间未满足真实场景需求,整个 AI 辅助编程工具体系离这一阶段还有距离。

    源自于:baoyu.io
    02
  • 伍鹏.
    1天前
    提示方法按功能可归类为:
    1.提升推理逻辑能力(COT、SC、LogiCOT、COS、S2A等)
    2.减少出错(CoVe、ReAct、R&R等)
    3.生成代码、执行(POT、SCOT、COC等)

    按优化方式可归类为:
    1.上下文学习(少量示例/无示例提示)
    2.过程展示(COT、草稿纸提示等)
    3.分解(L2M、P&S、TOT、ROT、SOT、等)
    4.组装(SC)
    5.转换视角(SimTOM、退后一步提示、R&R等)

    聚焦每种方法的具体提示词安排,可归纳为:
    1.强化背景信息(更客观、全面的任务背景)
    2.优化推演路径(更有逻辑、渐进的约束路径)
    3.明确目标(更清晰、可衡量的目标)
    00
  • Simon的白日梦
    1天前
    很详细的一篇完全借助AI从0开发app的教程~非常值得一读 (女友就是生产力🥹)
    给女友拍照老被骂,我花1天用AI做了一款姿势模板相机APP
    🧐 文章分享了一位产品经理通过 AI 工具快速开发一款相机应用的全过程,从需求发现到推广,实现了零代码基础开发并成功上架 App Store,展现了 AI 在应用开发中的高效和创新潜力。
    ➡️ 链接:mp.weixin.qq.com
    ✨ 重点
    ● 💡 发现市场需求:作者从日常拍照的困扰中发现灵感,验证了“拍照姿势模板”在情侣和旅行用户中的潜在市场需求,并通过小红书调研确认这一领域的空白。
    ● 🛠 AI 快速开发:借助 Cursor 等 AI 编程工具,作者在一天内完成了核心功能的开发,并通过简单的指令实现了从产品命名到 Logo 设计的全流程支持。
    ● 📱 产品核心功能:开发的“芝士相机”通过叠加拍照姿势模板,帮助用户更容易拍出符合预期的照片,吸引了大量对拍照有需求的用户。
    ● 🚀 从开发到上架:作者在无 iOS 开发经验的情况下,成功通过 Xcode 配合 AI 工具完成了 iOS 项目的全流程开发与审核,仅用五天时间实现上线。
    ● 🔥 高效推广策略:通过小红书和即时平台发布产品预告,在产品上线后的两周内持续发布相关内容,获得了近 10 万次曝光,并成功登上 App Store 摄影分类第 107 名。
    ● 🛡 AI 降低技术门槛:AI 编程简化了复杂的开发过程,让非专业开发者也能快速实现创意,强调“快”的重要性,鼓励用户勇于尝试。
    ● 💬 宣传和用户反馈:作者强调,尽管 AI 编程提高了效率,产品推广和用户互动仍需持之以恒,借助反馈不断优化产品体验。
    ● 🎯 实用开发建议:作者总结了 AI 开发中的实用技巧,如利用日志追踪错误、通过图像描述需求、持续与用户保持沟通等,有助于非技术背景的创作者快速上手。
    这篇文章不仅展示了 AI 编程工具的潜力,也鼓励普通用户通过技术创新实现个人创意,突破传统开发的技术壁垒。
    00
  • 刘勿锋
    4天前
    分享一个题目识别和还原的提示词。

    先说说背景:

    我们有一些客户拿着题目试卷的PDF,调用TextIn ParseX之后,经常会发现一些填空题里的划线空格没识别出来。大概长这样:“蕨类植物植株比苔藓植物_,具有 的分化,体内具有专门运输物质的 。”

    可以看到,上面题目中,“具有”后面缺少了3个下划线。但除非是专门做试卷场景的,否则常规的OCR应该都没在这里做过专项优化。

    不过有了LLM之后,简单加个后处理就能做好,毕竟文字和分句符号是对的,并且这种基础NLP任务,也适合让大模型来做。

    提示词贴出来如下:

    ### 背景与要求
    请提供以下题目,每个空格用下划线(__)表示,去掉答案部分。题目格式应保留原样,且每个空格不带任何答案,仅为下划线。

    ### 示例

    输入:“蕨类植物植株比苔藓植物_,具有 的分化,体内具有专门运输物质的 。”

    输出:“蕨类植物植株比苔藓植物__,具有__、__、__的分化,体内具有专门运输物质的__。”

    ### 待处理题目
    *******

    总之,只要用的OCR服务或者文档解析服务,没有专门做过填空题的优化,都可以用这个样式的提示词来做后处理,效果杠杠的。
    02
  • Simon的白日梦
    1天前
    写得很好得一篇个人开发者总结文章,2024年开发了11个项目,没有像很多人想的那样每个都能日入过万(甚至好多还是亏钱……),但是在不断精进之下最后一个产品还是实现了这个目标,虽然没有挣很多钱但是收获了最难得的快乐和成长。推荐想做独立开发的朋友都可以看一下。然后摘录一段我觉得很有价值的话:

    “我的年度关键词

    如果要用一个关键词来总结我的 2024,会是:祛魅

    对大部分的人和事都祛魅了。

    - 对产品祛魅了。

    不会再觉得 Perplexity / NotebookLM 之类的产品有多么神奇,只要自己愿意写,都是能写出来的。无非是体验的优化,以及营销推广方面的差异。

    - 对资本祛魅了。

    理解了投资机构的运作逻辑,意识到有些沟通是毫无意义的。不再对投资这件事抱有任何期待,打铁还需自身硬。只有做好产品,做出成绩,才能借助资本锦上添花。

    - 对大佬祛魅了。

    这一年认识了很多大佬,大佬身上有很多优秀的品质值得学习。对大佬保持必要的尊敬,但不会盲目崇拜。提升自己的实力,跟大佬平等沟通,才是最重要的。

    一年过去了,我发现我越来越 i 了,下意识拒绝很多交流和合作。每天的时间有限,还有太多的事情没做好。实在没有精力去维护太多关系。



    独立开发者idoubi:2024年,我上线了11款AI产品

    🧐 本文是独立开发者idoubi的2024年终总结,回顾了从自由职业的初始阶段到推出11款AI产品的经历,涵盖从工具开发到商业化探索的多个方面,展现了创新与坚持的力量。

    ➡️链接: mp.weixin.qq.com

    ✨重点

    ● 🧑‍💻 年度成果总结:作者在2024年内开发了多达20个AI相关项目,其中11个产品正式上线,包括AI壁纸生成器、红包封面生成器和AI搜索引擎等,体现了高效开发能力。

    ● 🚀 自由职业历程:2023年辞职后开启自由职业,强调“自由”的价值,并通过技术实践和产品输出建立个人品牌。

    ● 🔍 产品案例分析:详细分享了如ThinkAny(AI搜索引擎)和ShipAny(AI SaaS框架)等代表性项目的开发历程、推广效果和商业化尝试。

    ● 📊 挑战与反思:提到流量与商业化之间的平衡问题,例如部分产品因推广不足未能盈利,但通过ShipAny项目实现了“日入万刀”的突破。

    ● 🌟 个人成长与认知:作者对产品、资本和个人影响力的“祛魅”,强调长期主义和持续迭代对产品成功的重要性。

    ● 🎯 未来规划:2025年将聚焦产品优化和商业化突破,尤其是加强对市场需求的理解,继续拓展个人IP和探索AI技术创新。

    这是一个技术开发者用代码与产品记录下的努力与成长故事,为追求自由与创新的从业者提供了启发和参考。
    00
  • AIGC肖学长
    1天前
    给AI小白最好体验的AI设计工具,快用!!!
    01:11
    11