即刻App年轻人的同好社区

下载

Ruofan_rookie

245关注87被关注0夸夸

ESTJ | 🐜厂小后端
all in agent 🤖
新的一年 flag：落地一个 agent 应用

Ruofan_rookie

1年前

今日习得：如果 deepseek 的 <think> tag 可以被打断，加入各种交互，包括多模态，人类反馈，是不是就成了？

有对应的实现了么？

0 00

Ruofan_rookie

2年前

正式回归追赶各位

0 00

Ruofan_rookie

3年前

发现 AI 能力已经入侵了微信读书…

今天把一本英文电子书导入到微信读书之后，发现竟然自动生成了双语对照，而且导入速度应该不超过 5 分钟，粗看了生成的效果还挺通顺😁

续费会员理由+1

30 63

Ruofan_rookie

3年前

新一集布莱泽不多说直接开香槟🍾🍾🍾

0 20

Ruofan_rookie

3年前

分享今天听到的一句算法与工程跨界的话：

模型的训练是有状态的，推理是无状态的

（私以为可以从这个方向去考虑推理加速的优化方向

1 10

Ruofan_rookie

3年前

新出的这期播客讲了一些确实很 unpopular，但是确实很有启发的一些点，也印证了目前在做 LLM 生成的一些想说却没办法找到知音的一些观点，是嘴替无误了，一些 takeaways：

1. 看好移动端模型
2. 向量数据库和文本匹配搜索的结论(怎么搜索得好现在还是被低估了)
3. context 上的优化怎么做
4. 构建数据飞轮很重要，这个是AI产品交互上需要考虑的（参考 midjouney）
5. LLM 低代码是伪需求[旺柴] 但我论据上没办法像他这么组织，他有很多逻辑链在分享上没说出来

一个AI创业者的反思、观察和预测

科技沉思录

1 02

Ruofan_rookie

3年前

💻 最近工作上需要，开一个 NL2SQL 的坑，包含论文精读，工期更新等，功能包含但不限于 NL2SQL，也可以 NL2API，即刻作为一个快速记录。

📚 今天是这篇记录耶鲁大学 11 位同学构建 Spider-NL2SQL 测试集的论文，

arxiv.org

🤔 解决什么问题：

1️⃣ 以前的数据集要么重复性强，让模型仅仅需要学习问题与答案的匹配，泛化性很弱

2️⃣ SQL 样本太少，无法有足量的样本覆盖到各种 SQL 关键词，就算是 WikiSQL 数据集，也只充斥了 SELECT 开头的简单语句

Yale-Spider NL2SQL 数据集旨在解决以上的问题，旨在强调 NL2SQL 模型泛化性能力，同时需要胜任更加复杂的 SQL 语句生成任务。为此他们创造了这个数据集作为一个标准的 train-dev-test 数据集。

🐎 本文其实是一篇 NL2SQL 数据集准备的指导论文，有些 takeaways：

1️⃣ 数据准备：数据需要做以下预处理：
1) foreign key 需要表达清楚，表征不同表之间的关系
2) 有些 column 名是缩写的，文中尚需要将其转化为全称，比如要将 stu_id 转化为 student_id
3) 数据集构建就尽量要涵盖所有 SQL 关键词，并且在每个数据库中对每个关键词都要提供足量的例子

2️⃣ 入参要求：将模型对备选数 colunn 的搜索空间控制在同一个数据库（same database）中

3️⃣ 模型评估：模型评估需要解决筛选 column 次序上的问题，如 select, where 中的 column 顺序不一样，作者给了一段将 sql 语句基于关键词分解成 component 的方法可以解决这个问题。并且罗列了其他两种不同的评估方案

4️⃣ train-test split 方法：分为基于 example 粒度划分，和基于 database 粒度划分。前者在 train&test 数据集中会出现不同问题，针对相同一个数据库的情况。后者则保证了测试集中，不会出现训练集中的数据库信息，更加考验模型的泛化能力（因为测试集中的数据库字段模型都没见过）

我们可以针对自己的场景来选择构建我们自身的数据集和训练方案。

0 01

Ruofan_rookie

3年前

最近刚结完婚，一些筹备婚礼的 tip，这个只适用于在饭店吃饭的晚宴类婚礼

1. 摄影摄像不要省，因为我看了都直呼真香
2. 一定要多与策划沟通，增加属于自己的小心机，毕竟一生一次。把代码元素，aigc 元素融入之后，这是属于我们自己的婚礼啦
3. 门外的迎宾牌尽量极简，增加属于自己的东西最重要，比如照片墙，时间线等，不要搞太复杂。外面的布景不会有太多宾客留意，但会一眼看出属于新人自己的东西
4. 现场场控很重要，一定要联系婚庆公司安排好

最后，我家老婆最美！

33 63

Ruofan_rookie

3年前

尝试了一下 GPT-4 对于诗词的理解能力，并让它给出在 midjourney 中的 prompt，并且直接丢入 midjourney 进行测试（只增加了 ink wash painting 锁定风格）。

发现在给出解释方面较 GPT-3.5 信达雅了更多，并且能基于它的理解来生成对应的图片也更加地应景，几枝这个插件是不是可以考虑重写一个🐶

图 1: GPT3.5 的生成 prompt，看起来没有理解我的问题
图二：用“江南无所有，聊赠一枝春”来测试 GPT-4，用它的第二个 prompt 直接丢进 midjourney
图三：midjourney 生成的结果，图里的人确实挺想跟你分享春天
图四：用“长记曾携手处，千树压，西湖寒碧”来测试 GPT-4，用第一个 prompt 直接丢进 midjourney
图五：midjourney 生成的结果，把曾携手的渺小和孤独画了出来

103 945

Ruofan_rookie

3年前

学习

泛函: 周末的时候，和几位朋友一起编写了一份《AIGC 行业报告工作&企业应用场景研究》给大家分享一下：https://to7e2gkmim.feishu.cn/wiki/wikcnx7g6fmM0lejchNBXyq93Qg 这份报告非常长，推荐用电脑打开。下面👇🏻的图片是一些报告的片段，有很多是从即刻摘录的。仅作学习使用。感谢领路人@Musk-J 发起活动。也感谢在「AIGC探索站」这个圈子里持续分享的即友们。感谢@飞书做出了飞书文档这么方便协同的工具。图一：部分目录图二：部分技术介绍图三：AI 绘画工作场景应用研究（我主要负责的部分之一）图四：chatGPT 商业化场景研究

0 00