即刻App年轻人的同好社区
下载
App内打开

AI探索站

70952人已经加入

  • 陈知新
    5天前
    Chrome前段时间内置了Gemini Nano,写了个Chrome built-in Ai浏览器插件调用on-device AI👇
    chromewebstore.google.com

    🌟功能:使用Chrome内置的本地AI对话,处理简单的文字任务(Chrome dev版)

    🌟优势:数据安全,支持断网离线使用;响应速度极快,如视频所示。
    00:22
    1217
  • 我我
    6天前
    Claude有了artifacts之后,用来写一些小项目基本没什么问题了,一些对人类实习生的沟通技巧对他也有效:

    - 让他先从最简单基础的功能开始写,然后一轮轮提修改意见,这样可以方便检查他的作业,及时给反馈
    - 文件长了就让他拆分,这样每次迭代只需要修改相关的文件,可以很方便看出修改了多少,回复的文本量也不容易超出一次输出的token限制
    - 如果对他写的部分代码忍不了要亲自动手了,也把修改后的代码告诉他,让他直接看代码学习怎么做

    不过人类实习生随着指导会慢慢进步,成长之后不需要花费那么多精力做精细的指导了。
    而AI随着上下文变长,慢慢记不住前面的指令,犯的错只会越来越多,恨不得让他回炉重造,重开上下文
    21
  • 碎瓜
    3天前
    刚刚在武汉体验了一把萝卜快跑无人驾驶,记录一下感受:

    首先是使用过程:下载app,第一次要实名认证,然后像滴滴一样,选择起点和终点即可乘车。车到了之后,在车窗上输入手机尾号4位数,车门把手就会弹开,上车后系好安全带,点击座椅前屏幕上的“启程”按钮,车就会启动出发。抵达目的地后,车会停靠在路边,开门、下车、关门,就可以离开了。

    我的行程是从家去附近3公里外的商场,所以只体验了十几分钟,整体感受还不错,除了中途因为一次行人红灯横穿马路,紧急刹车让我有点不爽之外,其他的行驶体验都称得上很稳。

    一些缺点:
    1.目前可选择的上下车点位太少。从我家到商场,滴滴几乎可以不必步行,但萝卜提供的可选上车点,最近也离我家门口距离300米,我必须自己走过去,下车点也在商场马路对面。

    2.等待上车时间较长。抵达指定上车点后,地图上显示萝卜距离我1.6公里,正在结束上一单,预计8分钟抵达,所以我在原地又等了很久的车。我猜一方面是萝卜这两天爆火很忙,另一方面是它在拥挤路段的速度实在太慢了,动不动就停车,等电动车穿过去。

    3.实际接车点和地图有微小出入。我按地图去了一家店铺门口,远远望着萝卜车在离我20米的路边停了下来,后面车过不去,按喇叭滴滴它,我只好赶紧跑过去输手机号开门上车。

    我感觉的优点:

    1.当然是便宜。不知道是不是第一单有优惠,我的行程3公里只花了3.8块钱。

    2.不会有心理负担。相比司机,萝卜不会玩手机、外放其他司机的脏话语音,不会抽烟,我坐在里面,就我一个人的感觉,非常放松。

    3.我感觉卫生状况很不错。下车之后,我听到车里喷雾的声音,会喷好几分钟,好像是在消毒。

    这大概就是我第一次搭乘萝卜快跑的感受。在车里的时候,听到车外路人在喊 傻萝卜、苕萝卜,意外发觉这个名字取得挺好的,他们可能不知道"robo"的含义,但萝卜就很亲切。
    7659
  • EasyPlux
    1天前
    由于最近写 prompt 越来越多,那么对于 prompt 的版本管理需求也会越来越多。

    具体需求:
    1.prompt 的版本管理,需要有历史版本。
    2.同一个 prompt 在多模型下的表现。

    我测试了一些 prompt 管理的网站,包括:
    Athina
    Lunary
    Helicone
    Langchain
    Langfuse
    Promptknit
    Pezzo

    经过测试,比较好的版本管理工具是 Athina。它支持自定义 API key,并支持 prompt 的版本提交,可以在同一个模型下测试多个 prompt 的效果。

    app.athina.ai

    1.用Athina控制prompt 版本
    2.用 dify 测试多模型的效果

    prompt 开发好之后,如果想要测试多模型下同一个 prompt 的效果,可以使用 Dify,它支持添加多模型输出,非常方便。

    比如你可以同时测试同一个 prompt 情况下

    在 GPT4、deepseek、GLM4 的不同模型下输出的效果,有一个非常直观的比较。

    以上就是我最近体验的比较好用的 workflow
    414
  • 歸藏
    3天前
    这种在社交媒体开设虚拟人账号,然后利用付费订阅门槛赚钱看起来已经非常普遍了。

    Lalina 这个账号在 Ins 上有 12 万粉丝。

    我也点进去看了一下,面部一致性和照片表现的真实度确实很厉害,一般人不仔细根本看不出来。

    她通过Patreon订阅获利,订阅价格从每月5美元到300美元不等,提供照片和聊天服务。
    2051
  • 伊戈尔
    4天前
    最近让老照片“动起来”似乎很火。但是出现了更加有趣的效果:
    只要两张照片,就能让两个照片中的人物在一个视频中进行交互,最终生成了一个仿佛时光倒流般的动态视频。

    这个过程非常有趣且简单:

    1. 照片合成:在PS中将两张老照片放在同一画布上,调整位置和大小,确保两张照片自然融合。
    2. 视频生成:保存合成的图片后,通过可灵处理这张图片,几分钟内就能生成一个栩栩如生的视频。

    看着那些定格在老照片中的瞬间再次“动起来”,真的让人感慨万千。科技的力量让记忆变得更加生动,仿佛回到了过去的美好时光。
    00:20
    2650
  • 皮皮猪皮皮
    14天前
    Google在Chrome开发者版里集成了Gemini Nano,支持离线使用内置AI模型进行简单的任务,即使在断网情况下依然可以正常使用。on-device AI不仅保证了数据安全,响应速度也非常快。
    🌟体验流程
    1.安装Chrome开发者版本:www.google.com 并登录账号
    2.在Chrome开发者版访问"chrome://flags/#prompt-api-for-gemini-nano"并设置为"Enabled"
    3.访问"chrome://flags/#optimization-guide-on-device-model"并设置为"Enabled BypassPerfRequirement"
    4.访问"chrome://components",搜索"Optimization Guide On Device Model"组件,检查更新并确保是最新版本
    5.完成以上步骤后即可在console里调用window.ai,或访问我做的网页ChromeAI.org 进行体验

    🌟ChromeAI.org 对Chrome built-in AI做了些优化:
    1.用对话的形式和Chrome内置AI交互
    2.支持本地缓存历史生成纪录
    3.支持实时对话模式,AI响应时间在200-300毫秒
    4.支持离线使用,不会存储任何数据(项目已开源)
    00:15
    1659
  • 碎瓜
    17天前
    做的一个新玩具,来玩!

    汤很热 - 一个人的AI海龟汤游戏

    5440
  • 歸藏
    3天前
    微软前几天发布的 GraphRAG 架构非常厉害,但是具体的原理和内容可能不太好理解。

    Neo4j 的 CTO 写了一篇详细的文章《GraphRAG 宣言:为 GenAI 增加知识》。

    通俗易懂的介绍了 GraphRAG 的原理、与传统 RAG 的区别、GraphRAG的优势、知识图谱的创建和利用知识图谱工作。

    感兴趣的话强烈推荐看看。

    文章地址:neo4j.com
    833
  • 海辛Hyacinth
    5天前
    和阿文一起搭建了哈利波特单人动态 AI 海报工作流。

    上传一张你的照片,分院帽会为你自动分配学院,生成你的动态肖像照。除了四个学院外,有一定概率被发配阿兹卡班。

    ▶ 工作流下载地址:openart.ai
    2467