即刻App
年轻人的同好社区
下载
App内打开
狐狸魔法
25
关注
0
被关注
0
夸夸
狐狸魔法
9月前
歸藏: 多模态新时代来了,朋友们! Gemini一次对话直接生成所有故事的分镜图片和口播稿 我把这些扔到剪映里面排了一下,睡前故事视频就出来了 视频创作工作流要变了,视频有加速
0
0
0
狐狸魔法
9月前
艾逗笔: 新购一台 Mac Pro M4(10+10C/32G/2T)作为办公机器,分享一下我第一时间安装的软件👇 办公必备 - ClashX Pro - Chrome - Notion - Foxmail - Raycast 开发工具 - Cursor - Warp - OrbStack - Ollama - XCode 沟通交流 - 微信 - 微信输入法 - 飞书 - 腾讯会议 - Discord - Telegram 效率工具 - Bob Translate - Screen Studio - Arc 终端软件 - oh-my-zsh - homebrew - fnm + node + pnpm - pyenv + python + pip - goenv + go - rustup + rust + cargo 浏览器插件 - AITDK - Tampermonkey - ProxySwitchyOmega - SEOquake - CookieManager - 截屏长图 Master 还有哪些是你经常用的软件?欢迎补充。
0
0
0
狐狸魔法
2年前
Szhans: ✨ ChatGPT 推出个性化新能力:长记忆 一早起来,发现ChatGPT 悄悄在释放几个新东西: 🧠 Memory across chats 记忆大幅增强,可以横跨不同对话内容的连续性,记住更多的你。 🔒 Temporary Chat 隐私模式,不会记录任何你的聊天历史,也不会放入模型训练。 📒 Personalization 在个人设定里面,你可以主动训练ChatGPT更快、更明确熟悉你。 例如,和ChatGPT强调一下,「我有一只宠物」 ,以后它就不会忘记了。 从用户视角, 这无疑将带来难以想象的体验大提升, 人们更加离不开「更懂你」的ChatGPT;就像之前不少海外玩家把大量聊天记录拿给它,分析男朋友的心理动机和情感状态等,惊人的好用。 反过来说,不少AI 研究者早就猜到,聊天会并入训练新模型的一部分,成为Open AI先发优势的数据护城河。 而这一次特性升级, 也对整个AI 生态影响深远。 你怎么看?
0
0
0
狐狸魔法
2年前
Szhans: 完全赞同 👍 Claude 3 的结构化用法,已经成为我的「新日常」~
0
0
0
狐狸魔法
2年前
Kenny_肯尼: Runway推出了口型同步功能Lip sync,可以让人物说话,而不只依赖旁白。其实对口型早已不是什么新能力,runway只不过整合进自己的生成工作流里而已,AI产品们,也开始互相卷起来,下一步可能是更好的表情控制,动作控制,把生成单镜头的「布景、角色表演、声音」完善到拍摄单镜头的水平。 产品逻辑 1. 输入文本,选择音色/克隆音色,或者直接上传说话音频 2. 选择人像 3. 生成可以说话并且口型同步的视频 相关工具 - Pika:跟runway的能力和定位相似,前段时间刚刚推出 - Synclabs:专注做口型同步,可以对影视作品做翻译和口型同步,并提供API接口,效果很好 - Heygen:偏服务数字人场景 - D-ID:也是数字人场景,23年1月就有人用midjourney+D-ID做AI人物说话短片,例如The Bible as an 80s Sitcom https://www.youtube.com/watch?v=rjVv2raNLYw
0
0
0
狐狸魔法
2年前
歸藏: 整理和翻译了一下昨晚英伟达GTC大会的公告,下面是其中的十个要点(Claude 搞长文内容总结提炼真方便啊): NVIDIA推出新的Blackwell计算平台,旨在为万亿参数的大语言模型实现实时生成式AI。 Blackwell架构比前代Hopper架构的训练性能提升2.5倍(FP8),推理性能提升5倍(FP4),采用第五代NVLink互连,可扩展到576个GPU。 NVIDIA GB200 Grace Blackwell超级芯片通过900GB/s超低功耗NVLink芯片间互连,将两个Blackwell B200 GPU连接到Grace CPU,实现高度集成和内存一致性。 NVIDIA推出NVLink Switch芯片,每个可以以1.8TB/s的速度连接四个NVLink,并通过片上通信减少来降低网络开销。 NVIDIA GB200 NVL72是一个多节点、液冷、机架式系统,在单机架内可提供720 PFLOPS的AI训练性能和1.4 EFLOPS的AI推理性能。 全新NVIDIA DGX SuperPOD采用NVIDIA GB200 Grace Blackwell超级芯片,专为万亿参数模型设计,可提供11.5 EFLOPS的AI超算能力(FP4)和240TB高速内存。 NVIDIA发布NIM(NVIDIA Inference Microservices),通过组装加速库和生成式AI模型,让开发者能更轻松地构建和部署定制化AI应用。 NVIDIA Omniverse Cloud以API形式开放,让开发者能将Omniverse核心技术集成到设计、自动化软件和仿真工作流中,加速构建数字孪生应用。 NVIDIA发布Isaac机器人平台更新,包括Isaac Perceptor感知SDK和Isaac Manipulator机械臂控制库。同时宣布面向人形机器人的Jetson Thor计算机和Project GR00T通用基础模型。 NVIDIA与台积电、新思科技合作,将突破性的计算光刻(computational lithography)平台cuLitho推向量产,可将芯片制造中的光刻工艺加速40-60倍。 公告全文翻译:https://quail.ink/op7418/p/e88bb1e4bc9fe8bebegtce5a4a7e4bc9ae585ace5918aefbc8ce696b0e7a1ace4bbb6e38081e696b0e68a80e69cafe38081e696b0e69cbae599a8e4baba
0
0
0
狐狸魔法
2年前
刘驴: 数字人项目,从起号开始,2周内完成500粉丝增长。至今1个多月时间,运营2个数字人账号,通过提供付费数字人工具、数字人IP服务,实现月入3w
0
0
0
狐狸魔法
2年前
艾逗笔: 以下是我在做和想做的一些产品,大家有什么偏好或建议吗?👇 1. 套壳对话/画图/generator, trys.ai 2. RAG 联网搜索,thinkany.ai 3. 信息处理文章/音频/视频/pdf解析与摘要,zknown.ai, readknown.cn 4. 群聊总结/群管理工具,chatsum.ai 5. 取名智能体服务,namep.ing 6. GPTs 导航站, gpts.works 7. AI 通用导航站,aix.ing 8. 一键发布文章/视频/动态,提交产品工具,onepub.io 9. AI 数字人,声音转换/数字人克隆/复活,整合 heygen / whisper 的一些能力 10. 智能体工作流编排平台,类似 dify/fastgpt/coze 11. 代码生成平台,text-to-code,类似 v0.dev 12. 视频创作者工具,text->脚本->插画->视频->发布 13. AI 音乐播放器,类似网易云音乐,播放 suno AI 生成的音乐
0
0
0
狐狸魔法
2年前
歸藏: 软件开发者 Shesh 这个对软件开发未来的思考有点意思,描述了一下为什么他认为 AI 不会取代“软件开发人员”。 我翻译了一下全文,下面是主要观点和全文地址: 1️⃣ 软件开发的核心在于管理复杂性,将业务问题从现实世界转化为数字模型。 尽管Excel和低代码工具为业务用户提供了低门槛的数据组织、数据分析和流程自动化手段,但它们无法处理复杂的业务工作流程。 2️⃣ 业务逻辑必须以明确无误的格式定义,这是编程语言、Excel公式或低代码流程的共同特点。 即使未来的AI编码者能够根据对话英语指令生成软件产品,后台仍然需要一个正式的业务逻辑定义,这在本质上类似于“代码”。 3️⃣ 即使AI编码者能够从对话英语中生成业务逻辑,仍然需要人们理解后台生成的代码,并在必要时进行修改。 因此,直到AI编码者能够以确定性的方式生成这些业务逻辑,软件开发者的需求仍将存在。 全文翻译:https://quail.ink/op7418/p/e585b3e4ba8ee8bdafe4bbb6e5bc80e58f91e69caae69da5e79a84e6809de88083
0
0
0
狐狸魔法
2年前
jax_build: AI视频平台VMaigc https://www.subtitleflow.com 启动白名单测试,进入discord提交注册邮箱,即可体验 1.视频风格化 2.数字人 3.声音克隆 4.字幕生成以及字幕翻译 5.文本生成视频 等诸多AI生成视频功能,一起使用AI创造更多有趣的视频吧
0
0
0