小演说家的个人主页

即刻App年轻人的同好社区

下载

App内打开

小演说家

13关注0被关注0夸夸

小演说家

2年前

我叫no

好运小豆包: 那彭于晏…不就是…gun？

0 00

小演说家

3年前

Mark

歸藏: 答应大家的AI歌手教程来了，手把手教你训练你自己的AI歌手，主要分为使用模型和训练模型两部分，这里是第一部分如何使用模型生成音乐的部分，主要介绍了音源的处理，模型的使用和后期音轨的合成。看在藏师傅生病肝教程的份上希望各位多多支持，下面是具体步骤，图片顺序跟文字顺序对应🧶 详细教程和文件下载可以看这里：https://mp.weixin.qq.com/s/bXD1u6ysYkTEamt-PYI1RA 要使用模型进行推理的话你首先需要一段已经演唱好的声音垫进去，所以我们需要先对你垫进去的声音进行处理。首先要安装UVR_v5.5.0，完成后我们需要给UVR增加一个模型解压UVR5模型文件将里面的两个文件夹粘贴到安装目录下的Ultimate Vocal Removermodels就行。在处理之前你需要把你声音的格式转换成WAV格式，因为So-VITS-SVC 4.0只认WAV格式的音频文件，现在处理了后面会省事点。可以用这个工具处理：https://www.aconvert.com/cn/audio/mp4-to-wav/ 处理完音频文件后我们就要开始利用UVR去掉背景音了，一共需要过两次，每次的设置都是不同的，下面两张图分别是两次的参数。接下来我们就要运行整合包的Web UI来推理声音了，如果你用的其他人的模型的话你需要先把模型文件放进整合包对应的文件夹下面：首先是模型文件夹下面后缀为pth和pt的两个文件放到整合包的logs44k文件夹下。之后是模型文件里那个叫config.json的json文件，放到整合包的configs文件夹下面。接下来我们就可以运行整合包的Web UI了，打开整合包根目录下的【启动webui.bat】这个文件他会自动运行并打开Web UI的网页，经常玩Stable Diffusion的朋友肯定对这个操作不陌生。下面就是Web UI的界面我们使用模型的时候主要用的是推理这个功能。之后就是选择我们的模型，如果你刚才已经把模型放到合适的位置的话你现在应该能在下图的两个位置选择到你的模型和配置文件，如果有报错会在输出信息的位置显示。选择完模型之后我们需要点击加载模型，等待一段时间Loading之后模型会加载完成。Output Message这里会输出加载的结果。之后就是上传我们处理好的需要垫的音频文件了，把文件拖动到红框位置就行。接下来是两个比较重要的选项怕【聚类f0】会让输出效果更好，但是如果你的文件是歌声的话不要勾选这个选项，不然会疯狂跑调。【F0均值滤波】主要解决哑音问题，如果你输出的内容有比较明显的哑音的话可以勾选尝试一下。设置好之后我们点击【音频转换】按钮之后经过一段时间的运算，就可以生成对应的音乐了。【output audio】的位置就是生成的音频了可以试听，如果觉得OK的话可以，点击右边三个点弹出的下载按钮下载。我们现在生成的是一段只有人声的干声，这时候我们刚才剥离出来的伴奏就有用了，把两段音频合成就行，我用的剪映，直接把两段音轨拖进去导出就行，也可以加张图片变成视频。

0 00

小演说家

3年前

学会了，以后用这个模板来交朋友

泛函: 🥹真心希望，朋友们都好好盘一盘自己的社交偏好，并且直球地用文字写出来，这样在一起玩的时候真的会舒适很多。我来打个样： 1️⃣长时间通勤会让我特别疲惫，如果要线下见的话，如果你愿意主动跑远一点点来减少我的通勤时间，我会感动到落泪。 2️⃣ 我痴迷于方法论和策略，聊天话题可围绕“领域”、“项目”、“职业规划”、“个人品牌”展开。 3️⃣如果从日常爱好开始聊的话，可以从“运动”、“读书”、“美剧”、“电影”入手。 4️⃣ 我不是很喜欢旅行，因为很累，and 旅行玩之后会有生活失控的感觉。 5️⃣和我聊天的万能开头：“最近在忙什么呀？”“最近在学什么呀？”“最近发现了什么有趣的工具嘛？” 6️⃣ 我对自我探索和亲密关系的话题可能不是那么感兴趣，因为会一不小心就掏心掏肺，可是我害怕对人掏心掏肺。 7️⃣ 我对工具产品特别痴迷，特别擅长安利各种软件、网站、App，这个可聊。 8️⃣在我的价值偏好中，“卷自己”>“爱自己”，“对自己狠一点”>“对自己好一点”。 9️⃣ 我对国际关系、地缘政治等等话题没有任何兴趣，千万不要提起。 🔟 对美食的兴趣并不大，比起去吃什么，和谁一起吃、吃的时候聊什么会对我更重要。 1️⃣1️⃣ 爱好内容创作，如果你想邀请我一起录播客、做直播、录视频、写东西，那一定来者不拒。 1️⃣2️⃣ 我平常抗压能力挺不错的，泪点不低。但是看小说、电影、漫画、动漫、剧经常容易深度带入，常常在电影院和飞机&火车上哭的稀里哗啦。啊对了，我是射手座，以前是 ENFP，被生活磨炼成了 INTJ，很享受当 INTJ 的感觉。你的呢？可以分享一下嘛👀

0 00

小演说家

3年前

Diiiii: 两期和大模型有关的播客，值得一听。 1. 《AI大神贾扬清离职阿里后首次受访:创业为什么不做大模型》，https://www.xiaoyuzhoufm.com/episode/6435422f6341155b5195ade3 贾扬清老师出来创业，没有选择去做基础大模型，而选择了去做应用开发平台，以下是他对大模型时代的几个基本判断： 1. 开源主导的模式会成为主流。在 AI 领域，模型的保鲜期（shelf life）基本上是一年左右。以 2012 年 AlexNet 为例，6 个月到一年之后就会出现效果接近的模型，基本都是如此。基于开源与公开数据集，目前已经可以训练出非常高质量的模型。因此，扬清老师的判断是开源主导的模式会成为主流。 2. AI 更像应用，而不像数据库。这是因为像微服务这种写应用的指导很难标准化，基本上没有一个像 SQL 这样的统一标准。 3. 聊天机器人并非应用形态的全部。实际应用中，产品的形态不会是纯问答模式，企业可能有不同的使用形态。 4. AI时代有构建应用开发平台的机会。在开源模型的基础上，如何帮助开发者在各类应用模式与交互模式中，更容易地使用这些语言模型，包括如何更好地部署模型，是否有更弹性的、更稳定的、更低成本的部署模式，等等，这些是更明确的用户需求。这需要有平台作支撑，这可能是主要需求之一。衡量这个平台的关键指标，一个是开发者效率，另一个是核心系统性能指标，即在有限的资源里面，能够帮助用户拉起来多少数量的服务，以及多少体量的服务。这是他们团队创业要解决的问题。 ------------------- 2. 《大白话聊 ChatGPT（Sarah & 王建硕）》，https://www.xiaoyuzhoufm.com/episode/641183b5bb1fc0cb68f810c6 建硕老师的这期播客，虽然是面向零基础小白的，但表达得非常清晰，听下来还是有不少启发。一些核心的观点摘录： 1. 关于GPT原理最为精准的类比来自Ted Chung：GPT就是将人类知识压缩成一张模糊的JPG（然后再用超分辨率的方式还原出来，过程中还原得不精准的地方就是“幻觉”，Hallucination）。建硕老师自己对GPT4的类比是阿帕奇，同时将GPT4的训练数据类比为阿帕奇的帮助文档； 2. GPT分为“快思考”（系统1）和“慢思考”（系统2）。快思考可以类比为“顺口溜” - 唐诗听多了，不会吟诗也会吟；慢思考（chain of thoughts）是指GPT4可以通过步骤拆解来提高正确率； 3. 交互方面，经历了 BUI（Button User Interface，按键交互）、CUI（Command User Interface，命令行交互）、GUI（Graphic User Interface，图形界面交互）之后，大模型时代的交互方式变成了LUI（Language User Interface，自然语言交互，建硕老师自己的定义）； 4. 类比互联网的发展历程，目前Web3所处的节点相当于互联网的1979年，DNS等很多协议都出来了，但还缺少一个定义性的体验时刻，而AI所处的节点相当于互联网的1994年，浏览器出来的时刻。不幸的是，在此之前的NLP等技术都可以宣告被淘汰了，而幸运的是，浏览器本身只是一扇门，真正的机会属于千千万万的网站和应用。目前大模型的竞争类似于微软和网景对浏览器入口的争夺，尽管微软赢了，但也因此错失了后面整整的一个时代； 5. AI时代的生态想像：很多小机器人相互之间用API连接调用，最终通过一个LUI和终端用户互动。由于小机器人很多，因此需要通过一套类似域名的寻址系统来访问 - 这也是建硕老师正在做的一种服务； 6. GPT4本身并没有太多科研层面上的创新，但这并不妨碍它的伟大。人类历史上的很多伟大的时刻，例如发现新大陆、登月、发明iPhone等等，本质上都是工程的胜利； 7. 尽管国内大模型目前落后GPT4很多，但按照目前投入的财力和决心，最终一定可以做出效果相当的大模型。这就跟哥伦布发现新大陆以后，第二次再去新大陆的难度是一样的。已经有前人指出了一条明路，站在巨人的肩膀之上，难度会低很多； 8. GPT4肯定有智能，但肯定没有自我意识。问题是，人类也很难说自己有自我意识，很多时候只是在自作多情而已。很多时候，我们的人生只是各种硬件（DNA、身体结构）+软件（文化、历史、习惯、教育）所运行出来的结果而已； 9. 失业潮不会到来的，因为历史上的每一次技术革新都创造了新的工作。（这点持保留意见）贫富差距可能会变大，政府可能需要在财政制度上做出相应的调整，来进行财富的重新分配； 10. 对版权、隐私、垃圾内容、虚假信息等问题不必过份担心，这是新事物出现的必然产物，随着社会的发展都会得到自然解决。不要因噎废食； 11. GPT4有可能会促进社会的共识 - 在推荐时代，千人千面的算法让每个人都陷入自己的信息茧房，让社会空前割裂。这可能会在大模型时代得到某种修正。大模型再次让大家看到了一致的世界，在同一个场景下进行有益地讨论（这点持保留意见）； 12. 做一个科技乐观主义者，相信科技会造福人类，同时尽自己所能来帮助年轻人来更好地体验这个新世界。

0 00

小演说家

3年前

如何看待微信？它是否是个合格的产品？目前的微信有没有背离创建的初衷？@AlphaChat.ai

0 20

小演说家

3年前

如何看待微信？它是否是个合格的产品？目前的微信有没有背离创建的初衷？@AlphaChat.ai

0 20

小演说家

3年前

哎，感觉自己分享欲挺强，日常生活接触的人也不少，但是却不知道分享给谁，有心事也是自己消化。而且自己好像越来越封闭，和朋友的交流仅限于吃喝玩乐了。

0 10

小演说家

3年前

好像发现了个宝藏APP

1 00

小演说家

3年前

来到即刻的第一天。

0 00