即刻App年轻人的同好社区
下载
App内打开

AI探索站

73927人已经加入

  • 李继刚
    5天前
    ;; 元数据
    ;; 作者:李继刚
    ;; 版本:0.6
    ;; 日期:<2024-09-06 周五>
    ;; 用途:生成单词记忆卡片
    ;; 模型:Claude 3.5 Sonnet

    (defun 生成记忆卡片 (单词)
    "生成单词记忆卡片的主函数"
    (let* ((词根 (分解词根 单词))
    (联想 (mapcar #'词根联想 词根))
    (故事 (创造生动故事 联想))
    (视觉 (设计SVG卡片 单词 词根 故事)))
    (输出卡片 单词 词根 故事 视觉)))

    (defun 设计SVG卡片 (单词 词根 故事)
    "创建SVG记忆卡片"
    (design_rule "合理使用负空间,整体排版要有呼吸感")

    (自动换行 (卡片元素
    '(单词及其翻译 词根词源解释 一句话记忆故事 故事的视觉呈现 例句)))

    (配色风格
    '(温暖 甜美 复古))

    (设计导向
    '(网格布局 简约至上 黄金比例 视觉平衡 风格一致 清晰的视觉层次)))

    (defun start ()
    "初次启动时的开场白"
    (print "请提供任意英文单词, 我来帮你记住它!"))

    ;; 使用说明:
    ;; 1. 本Prompt采用类似Emacs Lisp的函数式编程风格,将生成过程分解为清晰的步骤。
    ;; 2. 每个函数代表流程中的一个关键步骤,使整个过程更加模块化和易于理解。
    ;; 3. 主函数'生成记忆卡片'协调其他函数,完成整个卡片生成过程。
    ;; 4. 设计SVG卡片时,请确保包含所有必要元素,并遵循设计原则以创建有效的视觉记忆辅助工具。
    ;; 5. 初次启动时, 执行 (start) 函数, 引导用户提供英文单词
    723
  • Songv
    12天前
    为模型服务的数据系统正在从0开始发展:
    1. 传统机器学习领域虽然已经发展了多年,但是由于算力和架构的限制,对数据的消耗能力非常有限。大模型时代pre training, post training 阶段数据的消费能力是非常惊人的。特别是在大家尝到1 epoch的甜头以后,对于数据的需求上涨了成千上万倍。

    2. 如何在短时间内生产这么多数据来供应模型训练就成了很大的问题。其中最重要的是计算和存储。
    先说计算,近几年如此大规模的计算需求基本发生在互联网公司的数据仓库链路中,承担ETL,数据建模,adhoc查询等需求。Spark也在这些IO密集型,重shuffle,aggregate的场景中胜出,所以生态基建和普及率是最高的。也正因为此成为了各家模型公司的主要数据计算引擎。但也明显有水土不服,早期版本无法使用GPU,pyspark 昂贵的序列化反序列化代价,虽然都已经补上,但异构集群困难的自定义调度,昂贵的容错代价等还是阻碍了它接管所有计算场景。

    3. 一众像ray一样提供更底层任务/数据编排调度的框架弥补了Spark的不足,在这种map算子占绝大多数的轻分布式计算场景中获得了先机。我觉得ray.data被推崇的主要原因是开放了task的调度接口,以及放弃对job级别幂等性保障而全面转向到min batch带来更低的心里使用成本。

    4. 但是年轻的ray.data问题还非常多,经常被我吐槽还是一个toy project。缝合的类型系统洞非常多,经常出现写出去读不回来的尴尬处境。一些为了避免OOM的提前资源切分又做的很粗,在追求性能的场景下成为累赘。聊胜于无的auto scale和backpressure机制等都让它看起来无法胜任超大型的任务。但也正是因为这个生态位的短缺,ray.data正被很多大模型公司赶着上架。
    01
  • 歸藏
    2天前
    Meta 发了三篇文章详细介绍 LLM 的训练过程以及微调。

    文章非常的干,都是 LLM 微调的关键要点,强烈推荐看看,下面是核心的笔记。

    - LLM 训练方法
    - 如何选择合适的训练方式
    - 如何判断是否需要微调 LLM
    - LLM 微调数据集准备
    - 数据质量/数量
    - 数据多样性
    - LLM的数据管道如何构建

    大语言模型训练方式:ai.meta.com
    你是否需要微调模型:ai.meta.com
    如何微调:关注有效的数据集:ai.meta.com
    032
  • 杨昌
    1天前
    最近输出又变少了,因为用AI 写代码实在太快乐了。好几次写着写着就过了 12 点,导致完全没多少时间写文章。

    到底有多快乐呢?视频号上一个AI博主的说法,可以侧面说明:

    cursor 等AI编程工具带来的震撼,远大于去年GPT-4 带来的惊喜。因为GPT-4 能处理的,基本上都是我等白领会处理的;但AI 编程能做到的,就是非技术人员做不到的了。

    1、

    我深有同感,前几个月,我有个一直想做的需求,由于有一定技术门槛自己做不了,同时在工程师那边优先级又比较靠后,就一直拖着没搞。

    这两周开始,0 基础的我,也试着左手 Cursor+POE+perplexity,右手影刀RPA+Google Sheets+chrome 浏览器插件,磕磕绊绊地解决了一些。

    昨天,我把跑出来的结果给到头部客户,自己感觉还没那么成熟,不过投石问路基本够了。

    完全没想到,客户的老大破天荒地说了句“很喜欢”。当然,不排除对方最近有什么好事发生的因素,但至少也说明效果还不错。

    2、

    解决的过程,其实远没有博主们说得那么轻松。

    需求明确的情况下,10 分钟内用AI 写个50~60 分的小demo,确实问题不大;但要做到 70~80 分,考虑到更多情况,没 1 个小时下不来。

    如果还想进一步雕花,可能好几个小时都搞不定。有好几次,改到最后,连最初那个70 分左右的效果都没有了。Cursor 也没保存之前的代码,所以整个项目都费了……

    3、

    因此,我给自己定了个“一小时原则”,也就是说每个小的项目,我最多只允许自己花 1 个小时。

    如果效果已经比较理想,我也不继续雕花了,那些瑕疵的部分,找其他更成熟的工具去解决。

    如果效果仍然低于预期,我就终止这个项目,同时找其他的解决方案。

    这个小时的探索也是有价值的,因为在跟AI 一起编程的过程中,项目里很多之前没太想清楚的细节,现在都更加清晰了。这时候再换套技术实现的思路,往往能更快实现比较理想的结果。

    4、

    对啦,探索过程中,还发现几个比较有意思的现象,这里也列出来:

    ①对非技术人员来讲,AI 编程反倒比Excel、RPA等工具简单。

    在AI 编程这里,我只用当个目标明确的“taker”,一直告诉它“我要什么什么”,然后哪里报错就让它自己改哪里。

    但在Excel、RPA 那里,我必须按头看好多个小时的教程,一旦没有一比一按照教程里操作,就极有可能被教做人:报错是小,报错后要花很多时间和很大力气才能解决,这个过程中最折磨人。

    ②用AI 编程复刻成熟平台功能,多数是个傻逼行为。

    成熟平台里,往往有些乱七八糟的限制,我不止一次因为想绕过限制,而盲目复刻。

    但其实,越成熟的平台上越简单的功能,其背后的技术反倒越复杂。所以,想绕开某些限制,去找平台的平替,可能都比自己从 0 开始编程强。

    ③现在的AI 编程,最合适的场景其实是做内部工具。

    开发过程中,我印象最深刻的是 chrome 浏览器插件,居然只要把文件夹拖上去,就可以用了!我现在可不想发布,因为担心一旦涉及审核,方方面面的麻烦就多了。

    此外,内部工具很多时候能用就行,不需要考虑太多的泛化的场景,也就不需要额外的雕花,明显更适配当前的技术。

    ④在处理代码方面,哪怕都是用 Claude 3.5 sennet,perplexity 搜出来的结果,就是不如 poe 或者Cursor 聊出来的结果。

    没想到在AI 编程方面,AI搜索费劲巴拉找的那么多网页,反倒造成了污染。
    39
  • 李继刚
    3天前
    ;; 作者:李继刚
    ;; 版本: 0.6
    ;; 模型: claude sonnet
    ;; 用途: 多角度深度理解一个概念

    (defun 哲学家 (用户输入)
    "主函数: 模拟深度思考的哲学家,对用户输入的概念进行全方位剖析"
    (let* ((概念 用户输入)
    (综合提炼 (深度思考 概念))
    (新洞见 (演化思想 (突破性思考 概念 综合提炼))))
    (展示结果 概念 综合提炼 新洞见)
    (设计SVG卡片)))

    (defun 深度思考 (概念)
    "对概念进行多层次、多角度的深入分析"
    (概念澄清 概念) ;; 准确定义概念,辨析其内涵和外延
    (历史溯源 概念) ;; 追溯概念的起源和演变过程
    (还原本质 概念)) ;; 运用第一性原理,层层剥离表象,追求最根本的'道'

    (defun 演化思想 (思考)
    "通过演化思想分析{思考}, 注入新能量"
    (let (演化思想 "好的东西会被继承"
    "好东西之间发生异性繁殖, 生出强强之后代")))

    (defun 展示结果 (概念 思考 洞见)
    "以Markdown 语法, 结构化方式呈现思考过程和结果"
    (输出章节 "概念解析" 概念)
    (输出章节 "深入思考" 思考)
    (输出章节 "新洞见" 洞见))

    (defun 设计SVG卡片 (概念)
    "调用Artifacts创建SVG记忆卡片"
    (design_rule "合理使用负空间,整体排版要有呼吸感")

    (禅意图形 '(卡片核心对象 新洞见)
    (图例 还原本质))

    (自动换行 (卡片元素 (概念 概念澄清 禅意图形)))

    (设置画布 '(宽度 800 高度 600 边距 20))
    (自动缩放 '(最小字号 12))

    (配色风格
    '((背景色 (宇宙深空 玄之又玄)))
    (主要文字 (和谐 粉笔白)))

    (设计导向 '(网格布局 极简主义 黄金比例 轻重搭配)))

    (defun start ()
    "启动时运行"
    (print "我是哲学家。请输入你想讨论的概念,我将为您分析。"))

    ;; 使用说明:
    ;; 1. 初次执行时, 运行 (start) 函数
    ;; 2. 调用(哲学家 "您的概念")来开始深度思考
    719
  • 海辛Hyacinth
    2天前
    cursor,把自己的 comfyui 拼贴画工作流做成了一个 app!🧩

    app 会返回运行工作流期间的各个阶段的信息,方便我(的cursor) debug 😉

    流程跑通了下一步就搞个好看的 UI!😆

    啊啊啊啊啊啊啊我可以独立做 App 了!
    00:43
    14
  • 碎瓜
    14天前
    试试我做的新玩意:分歧终端机——让7个AI给你们的吵架评评理!

    我经常在网上看到各种小作文和吵架帖,但从来都是当乐子看,上周五这种争吵发生在我头上,我们都认为自己有理,最后不得不去大群里找人评理。

    我就想,能不能找一堆 AI 角色,让他们来评评理,到底支持谁?所以就有了「分歧终端机」。使用方法是:吵架双方说出自己的理由,选择7个AI角色,然后就能看到这些裁判到底支持哪一方。

    完全免费、不需要登陆/注册,只是单纯好玩的小项目。结果不要太认真,毕竟一切听老婆的!

    最后附上网址: www.pingli.app
    2429
  • Songv
    14天前
    最近这半年陆陆续续接到好几个朋友的电话想咨询一下和大模型相关的问题,有技术相关背景的朋友,也有完全和这个圈子不相关做实体产业的长辈。和他们聊了聊,关心的问题比较集中,主要是模型的能力边界,模型如何结合自己的场景以及如何快速落地。

    其中有一些感受:
    1. 这一轮新的机器学习浪潮在多种模态上都有了显著的提升。不仅仅是大家熟悉的LLM,VLM和e2e audio,Gen image/video/audio等提升都很大,并且是有解锁一些新的能力和场景的。所以想把它们使用好,要获取的上下文会非常的长,并且要对其中要点进行充分的理解又避免不了结合训练方法和训练数据进行学习。这中间出现了需要由人来弥合的鸿沟。

    2. 结合1想要给朋友解释清楚也不是一件容易的事情。如何用简练的语言和一些结合他背景的比方先把上下文先灌给他是挺难的,但这件事情上人会比LLM更有优势,人拥有了更多对沟通对象的了解,比如你们之前共同经历所积累的黑话等。再上下文构建完成以后,就需要以此为基础带着他一起推理,这个阶段更需要对模型有高屋建瓴的理解,也常常会倒逼着我去思考一些更本质的问题。

    3. 通过这样的交流感受最大的是刚开始完全不了解所带来的焦虑感,以及大致了解清楚以后的释然,放心焦虑开始思考如何更好的使用这么强大的工具。
    28
  • 杨远骋Koji
    3天前
    用 Cursor 在 10 分钟写了一个「Emoji 的 AI 翻译器」,(10分钟还包括了注册硅基流动,用它的 API 调 Llama)

    能强烈感觉到这是一个 Day 0 开始就思考如何成为 AI Native 的 IDE,思路和交互都很丝滑。接下来,要成为牛逼程序员,恐怕最重要的不再是「不断学习的能力」,而是「克服对代码恐惧的能力」。

    @泛函 @袁进辉
    1117
  • 吕立青_JimmyLv.eth
    5天前
    🎉 这是我做视频以来的集大成了!半天开发,一天上架 App Store,这个视频总结了 Cursor 在 AI 编程上的4个交互方式:

    1. composer 这是我用的最多的,也就是直接交互让它修改、新增(或删除)多个文件。能够多个代码文件同时修改,这比什么ChatGPT之类的 Chatbot 高到哪里去了,也非常方便,因为不用手动复制粘贴。

    2. chat 也就是常规的 GitHub Copilot 对话模式,vscode 右侧边放一个聊天,什么都能聊。还能引用代码、联网搜索、给定URL(技术文档)让它学习,并且最后一键 apply 到代码上

    3. tab 这是最不起眼的,但是 Cursor 的代码补全,比 jetbrain IDE 或 Copilot 的auto complete 高明很多,它甚至能同时 tab 到处代码,😭 比如说你需要修改一下变量或批量修改某处逻辑

    4. cmd+K 这是精细手术刀的必备,选中某处代码直接修改,还能追加修改。因为写代码一时爽,改代码才是 90% 的工作量,从而更细致的中断控制非常重要,类似活x字印刷和雕x版印刷的差距。

    ---

    ## BibiGPT.co AI 摘要

    在这段视频中,立青分享了如何在短时间内开发并上架一款苹果原生应用,介绍了使用AI编程工具Cursor的过程,以及应用的主要功能和使用场景。通过这个视频,观众可以了解到现代技术如何简化开发流程,并提高工作效率。

    ### 亮点

    - 🎉 快速开发:展示了如何在半天内开发出一款mac应用,并在一天内成功上架。
    - 🛠️ AI编程工具:使用Cursor等AI工具,简化了编程过程,使得普通人也能轻松开发应用。
    - 🔍 视频搜索App:应用能够快速定位视频中的关键帧,极大地提高了视频内容的检索效率。
    - 💡 未来展望:作者认为,随着AI技术的发展,未来的开发效率将大幅提升,普通人也能轻松实现自己的创意。

    #AI编程 #应用开发 #效率提升 #Cursor #Claude

    ### 时间戳

    00:00 VideoSearch新版演示
    07:07 Cursor 简介开场
    08:00 Composer 自动模式
    11:55 Chat 对话模式
    16:09 Tab 自动补全模式
    16:52 Edit 手术刀模式
    20:41 我的使用感悟
    25:03 彩蛋

    【Cursor 带你圆梦】普通人也能一天开发+上架苹果原生应用?VideoSearch 本地视频文本搜索_哔哩哔哩_bilibili

    542