即刻App年轻人的同好社区
下载
App内打开
SUKIII
490关注7k被关注29夸夸
👔 私人账号,专门胡说八道
🌂 副业画画
🍃 ENFP|辣妹🧏🏻‍♀️
SUKIII
5天前
10
SUKIII
7天前
尝试了下 @Letsfun 推荐的ChainForge来验收Prompt,成功跑通了。
需要做这些事:把评价标准提炼几条原则并把原则告诉GPT4这样更聪明的大模型。

比如我现在是这么写的:
我希望以下面的标准为建立Prompt的打分标准,满分10分,最低分0分。
1. 简洁性:关键信息点为精炼的1-2句话,方便用户快速获得要点。
2. 全面性:关键信息点至少5条,要包含主要论题、关键数据和事实、重要的引用、作者的观点与分析。
3. 符合预期:要点是最能体现主题、支持论点、揭示结论或反映作者意图的核心内容。

评估模型给出了7分的打分,并说明了打分原因。

但是 Web 版支持的模型太少,缺少 Functioncall 的能力,要调试所有场景下的 Prompt 还是要花点时间改造。
711
SUKIII
9天前
上次 Arc 发布会后,这两个功能已经逐渐被我高频用起来了。
Instant Open是最先上手的,Tidy Tabs 最近才慢慢用起来。
Tidy Tabs 是先在 Today Tabs 里原地分类,确实有用之后再添加 Folder。
很合理,对用户需求洞察很深入。
11
SUKIII
9天前
Apple 推出了 Ferret-UI,帮助 Siri 理解手机界面。
现阶段用 LLM RPA 有一个问题,LLM 通常会压缩图片分辨率,导致在UI界面理解上经常识别不准,也无法正确提取文字,识别UI元素。
看起来 Apple 对这个场景做了针对性的调整,有一个放大系统,可以将图像放大到“任何分辨率”,使图标和文本更具可读性。

可能代表着苹果在往 RPA 方向尝试。
1015
SUKIII
10天前
最近和几个朋友聊天记录:
1. 我问他是怎么建Prompt的验收标准的:准备好Query,归纳抽象理想回答的几条Principle,找一个更聪明的大模型基于这个Principle来给Prompt的结果打分,每次上线前跑1000条。
感觉挺make sense,想测试一下。

2.perplexity怎么解决搜索引擎响应速度的问题:去年8月份就宣布基于3.5版本的微调模型已经比GPT4快且效果好,且自研了推理堆栈(pplx-api),能大幅度提升响应速度。微调没那么难搞,只要场景垂数据集质量高,一周左右。

3.在厂里的朋友说在搞低代码搭建Agent,面向B端,找不到太落地的具体场景,还要搞权限数据集多环境版本,由于B端业务逻辑比较复杂,要依赖现有GUI,要跳卡片或者跳页面,比C端难做太多了。
68
SUKIII
12天前
平平无奇做饭天才:
*话梅年糕排骨
*鱼羹
*香菜牛肉
00
SUKIII
12天前
假期去看了宫崎骏的《你想活出怎样的人生》
和以前的作品很不一样的一部
全片都非常私人化
像是临终老矣,回顾自己漫长的一生

没有那么故事性
但还是非常真诚

13块积木也许寓意着他的13部作品
用13部作品一直在呼唤人类的善意,理想的国度,但垂垂欲坠,轰然倒塌。似乎在自嘲,最终什么都没有改变。

但真的改变了我。
50
SUKIII
20天前
送了朋友一个birthday dish
50
SUKIII
23天前
Suno首页打开像个黑胶转盘
00