即刻App年轻人的同好社区
下载
App内打开
凯祭恩Kaijien
179关注739被关注0夸夸
6年AI算法工程师(团队负责人)|现AI独立创业者
得到|obsidian&flomo|emacs&neovim|karabiner深度用户
置顶
凯祭恩Kaijien
29天前
看年前大家都在发布自己的产品,那我也发布一个哈哈,诚邀大家评价和测试~

名称:InfoGPT
一个chrome插件,现已发布在chrome store 上。
功能只有一个,可以在不同的网页上,配置不同的 prompt,按自己所需快速获取信息

需求缘起:
比如我自己,我每天都会去github趋势榜上看一眼有哪些新的AI项目,会去product hunt看看哪些AI产品有启发,会去X上看看行业大佬又发表了哪些动态,会去huggingface上看看新模型的演进。
所以每天我都会陷入一种纠结,就是如果我不看这些网站,我会缺少信息摄入,但是信息过多看的时间太长,看完就该吃午饭了...

所以,如果你也想每天大量的摄取优质信息却不想花太多时间,你可能尝试过了RSS,却发现它太折腾还不一定啥时候就失效(因为要和网站斗智斗勇),你尝试过其他的浏览器chat插件,却发现对话不是你要的过滤信息才是真正你想要的。那就试试InfoGPT吧,2分钟上手,2分钟配置,不需要折腾,简单高效。[nice]

产品特点:
1. 可以针对不同url,配置不同的prompt,满足只有你自己的、特定需求的"信息过滤"。
2. 插件本身免费,使用自定义api key,自定义使用各种模型,同样也可以使用本地模型(ollama、 lmstudio等)。我自己简单计算了一下,使用此场景效果很好的模型(比如72B左右),正常使用一年的云api费用,反正我自己就是拿命用,应该也就10块钱左右的token费用。
3. 预置prompt,不需要自己重头写prompt, 可以根据预置prompt按需修改,后面也看大家需求持续更新。
4. 技术原理上就不会被各种网站排斥,不会像RSS一样与网站对抗,虽然不是完全的自动化(只需要你打开对应的网页),但应该能提高八成的信息获取效率。(我就喜欢干这种用两成的投入,但能提高八成效率的事情哈哈,我个人不着急搞颠覆式创新,现在的AI进程点状的创新都不够呢)

未来计划:
1.首先我更想知道这个需求刚不刚(求喷,不玻璃心),所以当前我没有在外观上花太多时间,如果验证了这是真需求,我首先会优化产品颜值~ 所以这对你有用,请务必让我知道(点赞分享评论私信)
2.可以配置一键打开特定的几个网站;比如早上习惯性的一键打开多个网站同时过滤。这个功能起码我是需要的,只不过如果只是我自己用的话,我直接就alfred写个工作流就好,且我已经这么干很久了~
3.可以一键导入导出所有prompt:当然我更建议在自己的笔记里写好prompt再粘贴进来,prompt本身就是高质量的笔记。
4.可以点击总结的内容来跳转/高亮到原文相关的位置:当然我还不确定这是否能优雅的实现(前端和浏览器限制),我本身是做算法的,算法全栈我应该可以说很熟悉,但我的前端水平是靠AI的[捂脸]。
5. 倾听大家的意见

产品连接:chromewebstore.google.com

以上,感谢阅读、感谢评价、感谢使用。
buff:保持感恩、保持敬畏、求同存异~
47
凯祭恩Kaijien
1天前
什么是历史的延长线,以及什么是站在未来的延长线上,我想到了个很直观的例子。

对于特斯拉,他的挂档是在屏幕上。这种设计可能褒贬不一,比如:
1.很有科技感,引领汽车设计
2.有病吧,这挂挡多费劲啊,哪有机械挂挡好使?

但是如果按"延长线"理论来看,特斯拉为啥这么设计可能就不难理解了:

特斯拉从一开始,就是奔着无人驾驶去的,所有为了人的驾驶体验所配备的东西,这些对未来都不是有效投入。
所以他的决策逻辑是:在保持竞争力的前提下,在历史的延长线上的东西,能删掉就删掉;在未来的延长线上的东西,尽可能地去投入(自动驾驶、车机系统、生产线),真的很马斯克。

ps:与上一条动态一起,食用更佳。
ps again:再分析小米,他的决策逻辑是怎么让人可以有更好的使用体验,很互联网。所以同是造车,注定基因不同,表达也就不同。
可能从个体角度来讲,这都没有对错和可比性,只是你更愿意为了哪种决策逻辑来买单而已。(利益无关,我是极氪最早的一批车主,感谢还活着)

buff:仅主观思考,不代表客观事实,保持敬畏
00
凯祭恩Kaijien
2天前
内燃机刚发明时,那时主流的交通工具是马车,所以内燃机刚被用在车上时,长相如图2。我在想那时的人可能也觉得汽车就应该长这个样子吧。
落实到实际的决策和行动上,比如是不是会觉得生产牛仔帽(防晒)是个好生意。

AI刚被发明时,现在主流的编程工具是IDE,所以现在AI刚被用来编程时,大家都知道的,就是现在的AI IDE(cursor等等)。

so > 由此推(缪)论: 现在的AI IDE(以及大多AI应用) 和图二这种内燃机"马车"没啥区别!他是历史的"延伸",但不是即将到来的根本性变革。

ps:回复上一条评论时,写着写着来了思路:
(图片来自google图片,侵删)
21
凯祭恩Kaijien
2天前
感谢认真回复,稍稍讨论下,不一定对,求同存异~

1.因为是预测,所以我的假设是未来权重更新的成本会很低:
其实如果是自己用,现在类似lora的方式,给模型注入信息量的成本也不高,是成熟的技术。
现在的算法圈子里,非顶级玩家,基于开源模型继续训练(finetune也好其他也好),大家其实玩的很开心的,我的经验是想让模型"智力"通过finetune提升这很无力,但注入新的信息量没啥问题。

也是基于lora的思想,所以我在图中画了个副网络,降低权重实时更新的成本,而且我更倾向于未来会有更有效的方式,比如现在的moe,专家为啥不可以优胜劣汰[旺柴]。(已经有这方面工作了)

哦还有一个是,可能在我个人的视角,大家常说的大语言模型,多模大模型这些,算法角度这都是一个东西,网络结构训练范式都没有本质区别,为了方便理解就统称大模型了。且我相信未来(肯定)都是要多模态的,我个人会说肯定的事情很少,但作为香农的信徒,我认为这个是肯定的,且不以文明意志转移,只是技术进程还没到。

2.可能以我浅薄的认知,尝试从第一性原理的视角思考:
人需要的不是搜索引擎,人需要的也不是应用,人创造了各种应用是为了解决问题,人需要的是解决问题,而不是各种应用。
比如:
如果我有个问题,我跟助理(agent)说一声就解决了,那我就不需要搜索引擎。
我想吃麻辣烫,我跟助理说一声就ok,我就不需要作为应用的美团
我想写个程序,我跟贾维斯说一声就完事了,我就不需要cursor(ide)...emmm,未来需不需要写程序都是个问题。

所以可能我觉得,当前的应用,未来可能会把"前端"页面退化掉,京东变成物流api,美团变成外卖api,变成给agent用的一个个工具,他们也许没有分配权,从产品角度来讲他们会变成供应链模型。

理论可能一夜颠覆,但落地的技术是循序渐进的,所以当前会出现从vscode变化来的cursor。就像内燃机刚发明,汽车的样子是从马车演变过来的带轮子的沙发,但现在的汽车不长马车的样子。如图(来自google图片),历史角度我觉得现在的AI应用,和这个内燃机"马车"没啥区别。

---
but:预测是预测,但这也丝毫不影响现在行事,该用cursor还是点开开心心地用,遵循当下的进程[旺柴] //@易凡: 这里有几个值得细究的地方

1.如果“大模型”是指“大语言模型”,那本身其实是无法做动态推荐系统或动态搜索系统的,因为大语言模型的权重更新成本太高,而搜索引擎和推荐引擎的数据更新太频繁

搜索系统/推荐系统未来会和大语言模型做深度融合,但还是会基于传统的搜索引擎/推荐引擎做迭代

2.如果“大模型”是大语言模型/多模态模型+搜索/推荐引擎一起,那另说。

未来可能的变化点:搜索引擎toC的大部分流量被推荐引擎和大模型应用抢走,逐渐转为toB的基建。而B端对搜索结果的质量远比C端高,搜索引擎再难投放广告收割有信息差的用户(即“恰烂钱”)。但搜索引擎本身不会消失。

3.大模型作为基础设施,未来也不会直接面向大众。面向大众的是各个具体场景的大模型应用,比如cursor、秘塔、ima等等应用。

因为基底模型必须做得很通用,这会导致用户在描述具体问题是需要加载很多私人数据、环境及背景信息来“预热”(这也是早期prompt engineering存在的原因)。
但为了更快更聪明地服务用户,思维链、tool use协议,这些是大模型可以做的;私人数据、环境及背景信息,以及融合这些能力的UI,是大模型上层的应用做的。(我同时反对说大模型会让GUI不存在,聊天框其实是一个很简陋的过渡品)

而这些大模型应用才会直接掌握用户数据、注意力窗口,才有投放广告的权力。

凯祭恩Kaijien: 今天突然想推演一下未来的搜索引擎,应该长什么样子。 基于我当前的认知,我得到了一种可能性,很有意思: 大模型是基础设施,但对大众,收费模式可能不是税收模型,模型可以做到免费提供服务。

00
凯祭恩Kaijien
2天前
以模型效果确定行业地位,这点deepseek已经做到了。
有大量用户来用就有广告商愿意来投广告,把广告做成数据喂给模型。
所以deepseek确实有成为下一代"google"的潜力,且开源也不影响其护城河,就像pagerank也是开源的,模型时代能做的甚至更多。

接下来,只要做到"知识"可以实时更新,就具备了下一代搜索引擎的技术核心,如果再能做到比如每半小时更新一次开源的副网络权重,就可以做到所有部署deepseek开源模型的厂商,都帮其推荐了广告。

buff:仅是推演一种发展的可能性,不代表个人意见~

凯祭恩Kaijien: 今天突然想推演一下未来的搜索引擎,应该长什么样子。 基于我当前的认知,我得到了一种可能性,很有意思: 大模型是基础设施,但对大众,收费模式可能不是税收模型,模型可以做到免费提供服务。

00
凯祭恩Kaijien
3天前
今天突然想推演一下未来的搜索引擎,应该长什么样子。
基于我当前的认知,我得到了一种可能性,很有意思:
大模型是基础设施,但对大众,收费模式可能不是税收模型,模型可以做到免费提供服务。
137
凯祭恩Kaijien
7天前
我家猫咪已接入deepseek ₍˄·͈༝·͈˄*₎◞ ̑̑
00
凯祭恩Kaijien
8天前
情人节了,再掏出我的金星人翻译机发一波~ [旺柴]

金星人翻译机-AI帮你秒懂女生的语言

00
凯祭恩Kaijien
8天前
这两天我给《真需求》做了将近5万5千字的笔记,笔记可能已经超过了一些书的厚度,纯(语音)手打,为了思考,主要也是为了做个需求的智能体。

然后突然有一个想法,一个猜测,就是本书的评价为什么如此两极分化:

可能因为本书的语言,为了描述需求的本质,做了很多很多的抽象,而为了解释清楚这些抽象,为了没有误解,又不得不花大段的文本来解释这些抽象,所以它很长很厚。哈哈,分歧点这就来了~

举两个视角:
可能从产品经理的视角:本来就很简单的东西,为啥要搞这么多抽象啊,至于写这么长吗,搞这么复杂,干啥啊,没意思。
但是从程序员的视角:原本其他用产品视角编写的产品书,程序员可能缺少产品经理的常识,很难共鸣和理解。但抽象对于大多数程序员来说,可太熟悉了,天天抽象,没啥门槛。

这可能就是本书的价值,非产品出身且习惯做抽象的人,能够更高效地获取到产品常识,尽管它很厚。

buff:求同存异,我对书本身不想发表评价(虽然我个人很正向),汝之蜜糖彼之砒霜,都是带有视角的。但我对本书评价如此两极分化的现象,一直带有好奇~
10
凯祭恩Kaijien
11天前
有个需求,做AI电话推销:
我说现在是个AI的电话我就直接挂(除了雷电将军),不是技术问题,是生理反应。

然后想了一下,我说:"通话开头第一句话跟用户说,我是由deepseek-r1驱动的人工智能...",emmm...用户应该会继续听

ps:记录当下各种接入deepseek的现象。
20
凯祭恩Kaijien
11天前
今天的某条大厂新闻,以及回忆其近几年的动作,让我想起了塞班系统和诺基亚。

ps:遥想我高中时期,因为在我那是的记忆里,诺基亚应该就是最好的手机,他的宣传言论对那时的我也有很大影响,然后在安卓和ios盛行时(12年左右),我购入了搭载微软与塞班合作(还是收购)的诺基亚手机。[捂脸]
00