即刻App年轻人的同好社区
下载
App内打开
歸藏
516关注12k被关注24夸夸
产品设计师、模型设计师、 不会代码的独立开发者。
关注人工智能、LLM 、 Stable Diffusion 和设计。
置顶
歸藏
11月前
很多朋友最近老问我一些我之前写过的东西在哪里,所以整理了一下写个置顶贴,内容会定期更新:

1️⃣ 我运营的 AIGC 周刊每周一更新,主要内容是上周 AI 领域的重点动态解析以及相关的产品和文章:
op7418.zhubai.love

2⃣️ 我的Midjourney作品汇总和对应的提示词:
walling.app

3⃣️ 我开发的一些产品

帮你将 Midjourney 的图片和提示词快速收集到你的 Notion 数据库中:
mp.weixin.qq.com

帮你自动分段翻译 Midjoureny 官网的提示词:
mp.weixin.qq.com

利用 ChatGPT 自动监控对应领域的信息并处理和发送到Discord 频道:
op7418.zhubai.loveposts/2251721691841511424

4⃣️ 我写的一些教程

AI 歌手系列课程教你使用和训练自己的 AI 歌手模型:
mp.weixin.qq.com
mp.weixin.qq.com

Stable Diffusion 保姆级入门教程包括 Web UI 的部署和 LoRA 模型的使用:
op7418.zhubai.loveposts/2238998671356555264
op7418.zhubai.loveposts/2239983151969951744

Stable Diffusion 模型大神工作流解析:
mp.weixin.qq.com
web.okjike.com

教你十几分钟不用代码创建自己的AI应用
mp.weixin.qq.com
13103
歸藏
19:38
微软已经禁止美国警察部门使用企业级人工智能工具进行面部识别。

起因是军事和执法部门服务商阿克森公司发布了一款产品,利用GPT-4对来自人体摄影机的音频进行总结。

这样很容易因为LLM的幻觉和人种偏见造成误判。

妈的,想想就怕,可能你什么事都没做,结果因为LLM幻觉被捕了。

来源:techcrunch.com
00
歸藏
19:33
互联网上机器人和人类的活动已经几乎持平了,去年整个互联网的机器人流量占到了49.6%,AI的发展加剧了这个趋势。

感觉再过几年估计就全是机器人了,想找个真人聊天都费劲。完全由真人组成的社区估计有搞头。
00
歸藏
19:31
北弗吉尼亚州的Dominion能源公司表示,随着AI的发展数据中心客户的电力消耗已经需要好几个核电站才能供给了。

一些正在规划的数据中心园区需求的电力高达数吉瓦,一个吉瓦的电力大约可以供给75万户家庭。

太离谱了,感觉西部世界的一些场景很快会成为现实啊。
00
歸藏
19:16
刚看到这个研究太强了,可以实现几乎实时的 3D 高斯泼溅渲染。

只需要在车上装上设备正常前进就行,中等质量的渲染可以保证每秒60帧,高质量的可以保证30帧。

项目能够在保持大型场景的视觉质量的同时,通过高效的细节层次方案,实现远处内容的高效渲染,确保层级间的平滑过渡和明确的层级选择。

项目地址:repo-sam.inria.fr
00:26
10
歸藏
01:50
贾扬清说新的ChatGPT搜索能力吊打那些只是简单地调用传统搜索并用LLM总结"的包装器。

比如让它获取hacker news最热的内容并且给出介绍,其他AI搜索工具或者AI聊天工具都无法完成的很好。

因为模型必须真正理解它,将其转化为有意义的行动,看来Open AI 真的在搜索上发力了。

我尝试了一下前十条都很好,妹有幻觉在以前根本不可能。

来源:x.com
27
歸藏
01:49
开源的AI硬件 Frame AI 眼镜的演示。

你可以通过语音和 Frame 进行沟通,它的回复会显示在眼镜屏幕上,而且会有小图标表示现在的情绪。

Frame 是多模态的可以看到你现在看到的东西,这玩意很强啊,如果响应速度快点的话。

演示视频已翻译,官网:brilliant.xyz
03:08
12
歸藏
01:46
AI 视频做的 Burberry 广告,氛围和细节确实到位,有那味了。

来源:x.com
00:35
14
歸藏
01:45
Simulon 这个应用牛皮啊。

只需要下载app扫描周围环境,然后选择对应的模型。

之后等几分钟就会渲染好跟现实环境融合的MR视频。

来源:x.com
01:18
02
歸藏
2天前
艺术家 roberthodgin 做的一个牛皮实验

“老人戴着 VR 头盔的混乱房间”这个提示词用 Midjourney 生成 图像,然后用 ChatGPT 生成图像描述,重复十次

得到了下面的一组图片

图像的色彩和氛围非常连贯,从绿色到蓝色,从阴暗到光明

可以脑补一个小故事,前面是真实环境,后面是 VR 眼镜中的环境

来源:kottke.org
00:21
01
歸藏
2天前
Prometheus 2 一个专门用于评估大语言模型质量的模型。

之前也有一些开源的评测模型,但它们要么和人类评分差异很大,要么只能做固定形式的评测。

Prometheus 2的特点是:

1)它的评分和人类非常接近;
2)它既可以给文本直接打分,也可以比较两个文本哪个更好;
3)它可以根据用户给的具体标准来评分,而不局限于通用的标准。

论文作者通过合并两个模型的参数得到了Prometheus 2:一个模型是用直接打分的数据训练的,另一个是用文本比较的数据训练的。

项目地址和模型下载:github.com
15