即刻App年轻人的同好社区
下载
App内打开
艾逗笔
59关注4k被关注10夸夸
前腾讯高级工程师,微信后台开发
现自由职业者,all in AI
在做产品:ThinkAny / HeyBeauty / 知了阅读
艾逗笔
2天前
受一支烟花社区邀请,聊了聊 ThinkAny 背后的一些技术细节,欢迎大家收听。🥰

AI搜索引擎ThinkAny的介绍和相关优化

一支烟花AI播客

01
艾逗笔
3天前
天气真好☀️
11
艾逗笔
4天前
上周六晚上我在 aigcpm 社群做了一次关于 AI 搜索引擎的主题分享,主要聊到了 ThinkAny.ai 这款产品的功能和特点,RAG 搜索背后的技术原理,如何做好一个 AI 搜索引擎,以及我对 AI 搜索市场和未来发展的一些看法。

感谢 AIGC 产品研习社的邀请,视频剪辑得很棒,包含了四个小节,我的分享从第一节的 04:05 时间点开始,欢迎大家观看。🤨

01AI搜索引擎–ThinkAny的业务背景_哔哩哔哩_bilibili

614
艾逗笔
5天前
ThinkAny 已上线 gpt-4o 模型🎉
105
艾逗笔
6天前
淘宝一键试衣浏览器插件✅
审核通过就上线,敬请期待~
2036
艾逗笔
10天前
ThinkAny 已支持 DeepSeek-V2 模型,欢迎体验。🎉
78
艾逗笔
10天前
ThinkAny 四月份的数据出来了 有点难以置信 纯自然增长😂
2444
艾逗笔
11天前
新产品 HeyBeauty 发布到 ProductHunt 了🎉,请大家帮忙投个票:producthunt.com

一起来感受 AI 试衣的魔法吧😉
531
艾逗笔
12天前
新产品预告。😎
83
艾逗笔
15天前
关于ChatGPT Search 会杀死大部分 Wrapper AI 搜索引擎的讨论,我有一些不一样的看法👇

1. AI 搜索引擎的第一要义是准确度。

准确度的决定性因素主要是两个:问答底座模型的智能程度 + 挂载上下文的信息密度。

做好 AI 搜索引擎的关键,选用最智能的问答底座模型,再对 RAG 的检索结果进行排序去重,保证信息密度。

第一个步骤容易,第二个步骤很难。所以现在市面上大部分的 AI 搜索引擎,包括 Perplexity,准确度也就 60% 左右。

2. ChatGPT自己做搜索,首先保证了问答底座模型的智能程度。

其次在检索联网信息层面会做黑盒优化,包括 Query Rewrite / Intent Detection / Reranking 这些措施。

最终依赖自身模型的 Long Context 特性,效果就能做到比其他纯 Wrapper 类型的 AI Search Engine 要好一点。

3. 我并不觉得大模型厂商自己做 AI 搜索 就一定会比第三方做的好。

比如我做 ThinkAny, 首先接入 claude-3-opus,在模型底座智能程度方面,就不会输 gpt-4,第三方甚至能有更多的选择,针对不同的场景切换不同的模型。

其次,Long Context 也有很多模型能够保证。

再者,工程层面对 RAG 挂载上下文内容的优化,ChatGPT 能做,第三方也可以做。

4. 做好 AI 搜索引擎,最重要的三点是准 / / 稳,即回复结果要准,响应速度要快,服务稳定性要高。

其次要做差异化创新,错位竞争。比如对问答结果以 outline / timeline 等形式输出,支持多模态搜索问答,允许挂载自定义信息源等策略。

5. AI 搜索引擎是一个持续雕花的过程。

特别是在提升准确度这个问题上,就有很多事情可以做,比如 Prompt Engineering / Query Rewrite/ Intent Detection / Reranking 等等,每个步骤都有不少坑。

其中用 function calling 去做 Intent Detection 就会遇到识别准确度很低的问题。

llamaindex + embedding + Vector DB Reranking 也会遇到排序效率低下的问题。

6. AI Search + Agents + Workflows 是趋势。

AI Search 做通用场景,通过 Agents 做垂直场景,支持个性化搜索需求。

通过 Workflows 实现更加复杂的流程编排,有机会把某类需求解决的更好。

使用 GPTs 做出的提示词应用或知识库挂载型应用,价值点还是太薄。

7. 我个人不是太看好垂直搜索引擎。

一定程度上,垂直搜索引擎可以在某个场景做深做透,但是用户的搜索需求是非常多样的,我不太可能为了搜代码问题给 A 产品付费,再为了搜旅游攻略给 B 产品付费。

垂直搜索引擎自建 index 索引,工程投入比较大,效果不一定比接 Google API 要好,而且接入的信息源太有限。

8. AI 搜索是一个巨大的市场,短时间内很难形成垄断。

海外 Perplexity 一家独大,国内 Kimi/秘塔小范围出圈。各家的产品体验,市场占有率还没有达到绝对的领先,后来者依然有机会。

9. AI 搜索引擎需要尽早考虑成本优化。

主要支出在于大模型的 token 成本和搜索引擎的 API 请求费用。

成本优化是个持续的过程,比如可以自行部署 SearXNG 来降低搜索的成本,部署开源模型来降低大模型的 API 调用成本。

day one payment,趁早向用户收费也许是一种 cover 成本的好办法,但是也要考虑用户流失的问题。

👆以上是我个人做 ThinkAny.AI 一个多月以来的一些经验和思考。欢迎交流探讨。
2139