即刻App年轻人的同好社区
下载
App内打开
JimmyWang
180关注4k被关注4夸夸
每天分享一句所学,努力当一个有趣的人~
工具产品爱好者,《随意搜寻》主理人。
关于我:jimmywong.bio
置顶
JimmyWang
1年前
今年立了个 flag,计划每天发一句感悟,或者学到的冷知识,亦或者我觉得很不错的话等。

第一天:我们称之为文明的一切都是在过去 500 代人发明的。这样的时间跨度,还不足以使我们的身体和大脑进化。 我们仍然是一群尽最大努力,生活在完全不自然的环境中的灵长类动物。(来源: Tim Urban)
81
JimmyWang
4月前
之前一直想写 Stable Diffusion 相关的教程,但觉得 Stable Diffusion WebUI 可拓展性不强,自由度不够高,所以一直没下笔。最近尝试了下 ComfyUI ,才惊叹地发现这才是我想要的。市面上系统性的 ComfyUI 教程不多,所以最近跟朋友一起搞了一个新教程。希望对大家有帮助。

Index – Comflowy

619
JimmyWang
8月前
每周发一版 🎉
前几周主要都是做了一些优化,没有宣传,本周有几个大更新,欢迎各位下载试用。

⌛快速唤起功能

你可以通过键盘快速唤起我们的产品,目前支持两种唤起模式:
① 框选内容,然后按 cmd+c+c,比如你可以框选一段英文内容后,再使用翻译 bot 将内容翻译成中文,亦或者框选文章,让 AI 帮你润色。
② 不框选内容,按 cmd+option+K,会唤起一个输入框,你可以直接输入任意内容,并通过上下键选择对应的 bot。

🪟 Windows Version

我们终于有 Windows 版本了!!! 🎉 🎉 🎉

下载:bit.ly
00:16
02
JimmyWang
9月前
Learning Prompt 新开了一个「最佳实践」栏目,这个栏目不仅仅只分享 Prompt ,更多的是分享各种实用的 AI 用法。希望能帮助到大家。

如果你也有不错的想法,欢迎加入我们的 Discord 频道进行分享 😁:discord.com

🧮 使用 AI 记录每日热量摄入 | Learning Prompt

05
JimmyWang
9月前
每周发一版 🎉

本周 PoleStar Chat 更新了什么?
* 结果支持 Retry,并以 tab 的方式显示在一个消息气泡内。
* 支持 Outlook 和 Gmail 账号登录。

也欢迎各位曾经读过我的教程的朋友加入 PoleStar Chat 的 AI 学习 Discord 频道:discord.gg

肝完这份近20万人读过的 AI 教程后,我动手做了一款 AI 应用 - 少数派

16
JimmyWang
9月前
最近分享的东西比较少,教程也没有怎么更新。主要是因为我觉得单纯只是学习是不够的,还要尝试去开发一款 AI 产品。你才能真正地了解 AI 背后的能力。开发了一个月,我们的产品终于可供大家使用了。简单说来它是一款 AI 应用,但与市面上的产品又有亿点不一样😁 你可以在我们的 Github Page 上下载此应用:github.com

① 你可以像使用其他 IM 软件一样,使用 @ 的方式快速调用 AI 指令,就像是在群聊里 @ 人一样便捷。我们目前支持 100 多个 AI Bot。

② 除了支持文本模型外,我们还支持文生图模型。

③ 你还可以使用引用的功能,将 Bot 连起来用,比如可以用 Midjourney 指令生成器生成指令,再 AT 文生图 Bot,比如像这样。
00:30
28
JimmyWang
11月前
本周比较忙,看的论文不多,周五抽空看了下,我觉得有几个值得分享的。

① OpenAI 的 Let’s Verify Step by Step
链接:cdn.openai.com
简单说来,就是在训练 AI 做复杂问题的时候,让 AI 一步一步地生成结果,然后在每个步骤上给予奖励,而不是在结尾处给予单一奖励。比如让 AI 做一道数学题,步骤经过 ABC,最后结果算出来是 D,此时不应该在 D 处奖励 AI 算对了,而是在 ABC 中奖励。这样训练出来的模型,在数学相关的问题上,回答的准确性会更高。

我觉得这个训练过程,在教育人上也非常值得参考,学习不应该只判断最后的对错,而是要看步骤,奖励步骤,不断地给学生正反馈。

② 第二个是 OpenAI Sam 在一个大会上的演讲
链接:humanloop.com
演讲新闻稿,不知道为啥页面 404 了。我总结几个值得关注的点:
1. 接下来最高优的事情是让 GPT-4 更便宜,更快。
2. 今年可能会继续放开 Token 限制,可能会到 100K 甚至 1M Tokens。
3. Fine-Tuning API 将拓展到最新的模型。
4. 支持对话状态 API,意味着不需要反复传递信息,Token消耗应该也会少很多。
5. ChatGPT 目标是成为超级智能工作助手,open-air 会避免与客户竞争。另外,目前 ChatGPT 的插件还没有达到 PMF。

③ SnapFusion模型
链接:arxiv.org
这个模型是一个 Text-to-Image 模型,特点是可以部署在手机上,并且最快 2秒钟就能生成一张图片。

④ Is GPT-4 a Good Data Analyst?
链接:arxiv.org
最后这篇论文我觉得非常值得阅读。论文作者设计了一个框架,提示GPT-4使用来自各个领域的数据库进行端到端的数据分析,并使用经过精心设计的任务特定评估指标,将其结果与几位专业的人类数据分析师进行比较。结果和分析表明,GPT-4 可以生成与人类相当的结果。不过论文最后,还是保守了一些,提到 AI 是否能替代数据分析师,还有待验证。
39
JimmyWang
11月前
看了两篇最近比较火的论文,里面说的内容太过于牛逼,让我感觉有点吹牛 😂:

1. QLoRA:最大亮点是降低微调模型所需的硬件资源。使用这个技术,只需要用 48G 的 GPU 就能微调 650 亿参数的模型,同时还保留 16 位微调任务的性能。论文作者微调出来了一个叫 Guanaco 的模型,在 Vicuna 基准测试上达到了 ChatGPT 的 99.3%,而且这个模型只在单个 GPU 上微调 了 24 小时。论文作者估计,未来一个晚上,就能用 iPhone 12 Plus 微调 300 万个单词,这就意味着在手机上看到一个为个人定制的 LLM 成为可能。论文的 Github 地址:github.com

2. LIMA:这个感觉更牛,核心是结论是「大语言模型中几乎所有知识都是在预训练期间学习的,只需要有限的数据就能让提高模型的输出质量」,在论文中,研究人员基于 LLaMA 65 模型,仅用了 1000 个监督样本微调出了一个新模型 LIMA,在测试种,LIMA 性能部分追平 GPT-4,甚至好于 GPT-4(下图深蓝色的部分就是 LIMA 好于该模型的部分)。不过需要注意,实验样本比较少。论文地址:arxiv.org
310
JimmyWang
11月前
《圣经》创世纪11:4-9
人说,“来吧,我们要建造一座城和一座塔,塔顶通天,为了扬我们的名,免得我们被分散到世界各地。”
但是耶和华降临看到了世人所建造的城和塔后,耶和华说,“看那,他们都是一样的人,说着同一种语言,如今他们既然能做起这事,以后他们想要做的事就没有不成功的了。”
“让我们下去,在那里打乱他们的语言,让他们不能知晓别人的意思。”
于是耶和华使他们分散到了世界各地,人们也就停止建造那座城。

今天 Meta 使用 1100+ 语言的圣经新约数据集,每种语言32小时的数据,训练出了 Massively Multilingual Speech ,支持 1,100 多种语言,支持将这些语言的语音转成文本,文本转语音等功能,并且错误率只有 Whisper 的一半。

官方介绍地址:ai.facebook.com
21
JimmyWang
11月前
随意搜寻本周推荐几款 AI 产品,感兴趣的朋友可以看看:

1)第一个推荐的是我的朋友遥行搞的 Dora,支持 AI 生成网页,和 AI 辅助快速操作,感兴趣的朋友可以去看看,顺便去 PorductHunt 上点个赞:www.producthunt.com

2)第二款是一个叫 DiagramGPT 的产品,是一款可以让 AI 绘制图表的产品,我觉得案例里最令我惊艳的是给模型一段 Stripe 的调用代码,然后 AI 解释这段代码后,再将 Stripe 的调用流程图绘制了出来(图一):www.eraser.io

3)第三款是 Takomo ai,支持通过拖拽等方式将多个模型链接起来,非常酷。还有一个开源的 LangFlow 也很不错。感兴趣的朋友可以看看。takomo.ai github.com

4)最近一直在研究 Embedding,一直在用开源的 Chroma 向量数据库,最近看到他们上线了官网,官网上的这张图片很好地解释了 Embedding 和向量数据库是什么。www.trychroma.com

BTW 我的 Newsletter 稍稍升级了下,增加 AI 每周记事,感兴趣的朋友可以看看:xiaobot.net
545