即刻App年轻人的同好社区
下载
App内打开
郁枫
58关注445被关注1夸夸
公众号:AI变革家
假装幽默之10年运营老兵,超级个体践行者。
专注于分享AIGC教程、提效技能和变现之道。
致力于用AI+重做互联网+。
郁枫
4月前
Kimi终于跟上了步伐,图像识别升级了。
不再只是识别文字,还可以理解图像、图形、图表,补齐了之前的短板。
操作方式会有很多变化,比如理解准确率提升,解题范围扩大了,识人找资料,根据图像反推提示词,根据样式做类似图表等等。
补充下近期Kimi更新的功能。AI搜索升级探索版,搜好几百个网页,准确性提升;mermaid图表绘制升级,通用流程图最多三种格式,代码(可进行二次编辑),经典图和手绘图,更酷炫。都可以复制和下载图片,还可以点击去缩放,再也不用截图了。
Kimi+新增两个对接扣子的智能体,一是诺奖生成器,能生成海报;二是链接一键转播客,根据网页中的文本转为播客。
01
郁枫
4月前
今天整理文件,发现国庆节前准备了未发的夸克素材,还是发一发。

之前夸克电脑端融入AI,加了AI搜索,AI工具和全局AI助理,摇身一变,变成了类似豆包桌面版的“AIPC”。它也可以用插件比如Kimi浏览器插件。说几个比较实用的功能,目前免费,还可以薅。

1、批量去水印。弄的AI智能识别去水印,不支持涂抹消除去水印。优点在于可以批量去水印,效率比较高。这种很适合那种有固定水印,或者水印比较容易识别的场景。类似的工具,还有个去除手写,比如去除收据中的手写文字。目前这个功能在移动端APP是收费的。

2、图片批量提取文字。好处就在于可以批量提取,准确且方便。出来一些开源的,很多工具批量提取得付费。类似的,还有个图片转文档,也是OCR识别后转换文档的,也支持批量操作,比如将你多张图片中的文字整理到一个word,Excel或者pdf中,总之就是很方便。
3、AI文件阅读,之前的帖子提到过,沉浸式阅读形式,用AI助理对话操作。除了文档,也可以解析链接,都能生成脑图,还是比较方便。跟夸克网盘打通了的。

4、AI搜题,可以对话,截屏搜和传图搜,试了下,还是比较准的。

此外,还有些半收费的,比如AI视频总结,跟通义有点类似,可以时间戳跳着看,也可以导出字幕,还是很好用的。本地视频会传到夸克网盘,相当于有存储空间限制,超过后得买会员了。现在看高清或者导出字幕等,也需要会员了。

还有AI PPT和AI简历(腾讯文档也有个),生成免费,但导出收费了。其他的功能,还有文档格式转换,就是word,Excel,pdf等办公文档的转换。

近期大家比较关注图像处理和去水印工具,我整理了一些,供大家参考。r9vovlcblf.feishu.cn
02
郁枫
4月前
秘塔AI搜索上线了AI识图功能,可以免费转文本,识图解析,以及搜索相似图...

暨上次图片搜索正式上线后,又重锤传统搜索了。会自动检测不同的图片,给你相关功能,比如转文本,解题,给我讲讲和以图搜图。

优点在于可以对话操作,玩法较多,常见的比如:提取文字,看图说话和解题,根据图片生成提示词,搜索相似图,收集素材等等。

目前能点击和拖拽传图,希望可以增加Ctrl+V粘贴,复制链接识别等,那样就更好用了。
22
郁枫
4月前
有群友问到文档解析和阅读的问题,估计不少朋友有这种需求。我来拓展,举一反三一下。
对于AI文档解析、阅读和编辑,主要有三级:
第一级,文档解析(单纯解析文档);第二级,沉浸式预览(边预览边问答,可划词解释翻译等);第三级,前两级+AI智能编辑和导出(高级功能)。
操作方式大致有下面三种,可以解决你文档阅读,处理和编辑的问题。前两种方式很方便,最后一种方式基本通用。
1、文档AI一站式搞定
具备文档解析,预览,编辑导出和文档管理的AI工具,比如腾讯文档,钉钉文档,讯飞星火(Excel不能预览,但能用Python处理),WPS,百度文库(只有word能AI编辑)等,通过调用AI助理对文档进行操作,可以智能创作,自动润色,编辑,数据分析与处理(比如生成图表,筛选计算统计)等,这是AI垂直文档和知识管理的发展趋势。

2、沉浸式预览+AI问答
元宝,用深度阅读模式。功能都比较齐全,预览问答,划词操作都有。注意数据处理后的表格也可以下载为文档,用WPS或者Excel打开后,就能另存为表格。另外,AI写作可以去腾讯文档编辑,变成文档,用AI助理操作。
通义,较早推出沉浸式阅读的,功能很多,特色是生成脑图,提取PPT,文档翻译,点击时间轴跳转原文等。不能AI编辑,但可以摘录笔记编辑。导出格式非常多,word,pdf,.md,jpg,.xmind等等。
豆包,Excel和PPT文档不能预览,其他文档打开变成pdf,提问,划词都可以,支持导出为pdf,可当格式转换用。AI写作,可以生成文档,用AI来编辑,功能较为强大,可以一键智能配图(全网搜的),也可以AI生成和上传,还支持@官方智能体回答,最后导出为word和pdf。
智谱清言,除了PDF可预览,其他不能预览。跟豆包、橙篇类似,可对回答结果进行AI编辑,特色是对话时可以切换不同的智能体输出,比如配图,配图表,做表格等等,颇有老板叫不同员工干活的感觉,也能导出为pdf。
文心一言,内置的文档插件预览,不能修改,可以边预览边提问,但不能划词。
海螺,也是调用微软365预览,不同的是可以右侧对话,但不能划词。
万知,只支持pdf解析和预览提问,但不可划词操作。
橙篇,能对原文档预览,独立预览窗口(不能缩放,操作不是很方便)。也能对回答结果进行AI编辑,变成文档,导出为word和pdf。
天工,可以边预览边对话,生成脑图,但不能划词操作。
商量,可以边预览边对话,pdf可以划词,其他文档不能。
Kimi,百小应,跃问这几个都一样,都是调用微软365预览的,准确说不算沉浸式阅读。

3、微软office(365)预览+通用AI问答
只能做到文档解析和问答。可以全屏看文档,你发文件让AI抓取识别,在对话框中打开文档预览(得用支持调用微软365预览的AI,比如元宝,Kimi,海螺,登录微软账号另存OneDrive(需魔法)后可以编辑),在侧边栏打开AI(谷歌浏览器可以用Anything Copilot插件,edge就用侧边栏功能),直接对文档提问,优点是模型能力强,解析能力更好,缺点是不能AI编辑。如果是数据分析,最好用支持运行代码做数据分析的AI,准确性高,比如元宝,智谱,Kimi(用计算器功能,准确率很高)。
另外,还有夸克,百度网盘也可以边预览边提问,也支持划词操作。
03
郁枫
4月前
说说钉钉AI,近期接入了非常多功能,看几个主要的应用。

1、AI助理。5个月前分享过,近期增加了些功能,比较亮眼的有两点:一是全局AI助理,类似豆包和夸克,就是选中文字唤醒,可以解释,翻译、润色之类的。二是操作指令,通过对话统计昨天日常,整理碎片信息,整理记录等;还有打开钉钉应用,例如投屏,打开表格、文档,打开会议、投屏闪记(语音转文字)等等,还是方便。补充下,这个AI助理可以随时切换,比如换你自己创建的智能体。

2、智能创作。就是用AI创作后生成文档,比如写各类word文档、画脑图、绘图、生成PPT、创作视频(数字人播报视频),我觉得画脑图这个不错,支持编辑,可惜不能根据文档直接生成思维导图。

3、文档阅读以及AI编辑。文档阅读方面,常用的总结、摘要之类的都行,也可以对文档提问,比如帮你定位原文内容,计算或者解题等;AI编辑,除了多维表,其他类型文档都可以用AI编辑,比如润色,续写,生图配图,换风格,一键美化之类的。对表格的操作倒是有意思,用指令操作,比如AI创建表格,筛选统计,数据分析,分类绘图表之类的。相较飞书和WPS,AI功能更多些。前者个人用户接入AI功能少,后者多数AI功能需要会员(希望多开放些)。
补充下,文档AI和AI助理可以同步干活,格式转换等效率工具也比较好用。

阿里接入AI的应用场景非常多,几个主流产品,全部接入了AI,除了淘宝天猫,通义,支付宝,钉钉,夸克,都接入了,多数实用工具目前都免费,力度很大。

大厂狠起来,确实其他小厂就得抖三抖啊。
02
郁枫
4月前
继续说说元宝。分享我这两天在用的,实用的,才更新的俩功能:AI搜图和图片编辑。

1、图片编辑,目前开了几个常用功能,变清晰、去水印、扩图、局部消除和风格转换。可以像百度AI图片助手 那样,对你AI生成的图片、本地图片和网络图片(复制图片后粘贴)处理,效果不错,关键是免费且方便。

2、搜图。你可以搜AI图库中的各种风格和尺寸的图,可以免费下载,关键都是无水印的,用来做素材或者配图也不错。如果你是从AI生成的图中去搜,就是对这个提示词搜索相关的图。

这俩功能,都集成在了“灵感图库”这个智能体中。使用链接:yuanbao.tencent.com
00
郁枫
4月前
秘塔AI搜索正式推出了图片搜索功能。

原来搜索图片,需要加关键词,现在能直接搜。

特点是按照搜索词扩展分类,可以选择跳转,也有相关搜索建议,是要更方便点了。如果想个性化,可以考虑加些关键词。

下一步会不会是按图搜索呢,还是可以期待下,还有搜视频。
30
郁枫
4月前
上次写完元宝的文章,第二天他们又更新。深度阅读模式确实更好用了,现在任何文件都可以精读,

重点是能翻译文档并下载!这点没几个通用AI支持。

通义得行,分享过好几次了,这方面的扛把子。

紫东太初可以,有个论文精读的应用,可以直接翻译。只能对arxiv的论文链接识别后翻译。

豆包能翻译,但不能下载翻译文档。

智谱能翻译,也能下载,但是长文档不方便。

Kimi再不加油,就要掉队了。

还有一点,他总结、精读、翻译和脑图的内容,都可以对应下载。

应用方面,之前文章写过很多了。这次新增后,可以考虑翻译后,用来辅助解题,倒还是有意思的。
02
郁枫
5月前
用微博智搜来写文章初稿、帖子、朋友圈之类的文案,是个路子。他总结的内容AI味确实算少的了,你再用AI润色下,基本上可以直接用了。

很久以前,微博那些“充满人情味”的显眼包AI,评论回答的效果就很好了。主要是语料库里面的帖子有很多人生百态、日常感悟之类的优质内容和评论,这些用来训练效果确实不错,在于它更符合人们的口吻。

那怎么利用智搜结果来辅助创作呢?
比如说,你在微博搜了个热点,拿这个内容去扩写成爆文,或者改写成帖子,用AI来辅助润色就行了。不过智搜缺了个搜索来源,要是能直接找到来源就更好了。

做热点文、新闻类、社会百态、时尚、娱乐八卦之类的内容都可以。

延伸一下,可执行类似操作的平台比较多,比如微信、知乎、小红书(达芬奇)。
01
郁枫
5月前
好久没这样阳了…200多天…
今天不会还有人亏吧😫
00